Show simple item record

dc.contributor.advisorIndahwati
dc.contributor.advisorSuhaeni, Cici
dc.contributor.authorHanifah, Silmi
dc.date.accessioned2020-12-24T00:17:57Z
dc.date.available2020-12-24T00:17:57Z
dc.date.issued2020
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/104417
dc.description.abstractTwitter merupakan salah satu sumber data untuk klasifikasi teks. Model Bernoulli Naive Bayes dapat digunakan pada pengklasifikasian data teks dengan jumlah teks yang tidak terlalu panjang seperti halnya data twitter. Model Bernoulli menggunakan informasi kejadian biner sebagai peubah penjelas, dimana 0 dan 1 menggambarkan kata tidak muncul dan muncul dalam dokumen. Strategi estimasi pada pengklasifikasian model Bernoulli memperhitungkan kata yang tidak muncul dalam dokumen sehingga model Bernoulli ini lebih sensitif terhadap noise feature yang dapat mengakibatkan performa kinerja klasifikasinya menurun dan waktu komputasinya lama dikarenakan parameter yang perlu diestimasi sangatlah banyak. Salah satu solusi untuk mengatasi masalah tersebut adalah penerapan seleksi fitur atau metode pemilihan fitur. Penelitian ini menggunakan 4 metode pemilihan fitur jenis supervised feature selection, yaitu Information Gain (IG), Symmetrical Uncertainty (SU), Chi-Square (CHI), dan Extended Odds Ratio (EOR) dengan menggunakan teknik filter, yaitu pemilihan sekumpulan kata yang berpengaruh terhadap penentuan pelabelan yang dilakukan pada tahap prapemrosesan data. Tujuan penelitian ini adalah membandingkan performa kinerja klasifikasi dan waktu komputasi model Bernoulli Naive Bayes sebelum dan setelah menerapkan metode pemilihan fitur dengan teknik filter, serta membandingkan performa kinerja klasifikasi dan waktu komputasi metode pemilihan fitur jenis supervised feature selection pada algoritme Bernoulli Naive Bayes. Hasil penelitian menunjukkan bahwa performa model seleksi fitur dengan teknik filter tidak lebih baik daripada model tanpa seleksi fitur sehingga teknik filter ini tidak disarankan untuk digunakan pada pengklasifikasian kasus riskan (besar resikonya). Namun dilihat dari waktu komputasi, model seleksi fitur dengan teknik filter memiliki waktu komputasi yang lebih singkat. Hasil perbandingan di antara model seleksi fitur jenis supervised feature selection menunjukkan setiap metode seleksi fitur memiliki perbedaan dalam menentukan fitur yang berpengaruh. Model dengan performa kinerja paling baik dan memiliki waktu komputasi yang paling singkat pada Bernoulli Naive Bayes adalah SU, sementara model dengan performa kinerja paling rendah dan tidak efisien dari segi waktu komputasi adalah EOR.id
dc.language.isoidid
dc.publisherIPB Universityid
dc.subject.ddcStatistics and Data Scienceid
dc.titlePerbandingan Metode Pemilihan Fitur dengan Teknik Filter pada Algoritme Bernoulli Naive Bayes Menggunakan Data Twitterid
dc.typeUndergraduate Thesisid
dc.subject.keywordBernoulli naive bayesid
dc.subject.keywordnoise featureid
dc.subject.keywordseleksi fiturid
dc.subject.keywordteknik filterid
dc.subject.keywordtwitterid


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record