View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - Faculty of Mathematics and Natural Sciences
      • UT - Statistics and Data Sciences
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - Faculty of Mathematics and Natural Sciences
      • UT - Statistics and Data Sciences
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Perbandingan Metode Pemilihan Fitur dengan Teknik Filter pada Algoritme Bernoulli Naive Bayes Menggunakan Data Twitter

      Thumbnail
      View/Open
      Fulltext (12.31Mb)
      Date
      2020
      Author
      Hanifah, Silmi
      Indahwati
      Suhaeni, Cici
      Metadata
      Show full item record
      Abstract
      Twitter merupakan salah satu sumber data untuk klasifikasi teks. Model Bernoulli Naive Bayes dapat digunakan pada pengklasifikasian data teks dengan jumlah teks yang tidak terlalu panjang seperti halnya data twitter. Model Bernoulli menggunakan informasi kejadian biner sebagai peubah penjelas, dimana 0 dan 1 menggambarkan kata tidak muncul dan muncul dalam dokumen. Strategi estimasi pada pengklasifikasian model Bernoulli memperhitungkan kata yang tidak muncul dalam dokumen sehingga model Bernoulli ini lebih sensitif terhadap noise feature yang dapat mengakibatkan performa kinerja klasifikasinya menurun dan waktu komputasinya lama dikarenakan parameter yang perlu diestimasi sangatlah banyak. Salah satu solusi untuk mengatasi masalah tersebut adalah penerapan seleksi fitur atau metode pemilihan fitur. Penelitian ini menggunakan 4 metode pemilihan fitur jenis supervised feature selection, yaitu Information Gain (IG), Symmetrical Uncertainty (SU), Chi-Square (CHI), dan Extended Odds Ratio (EOR) dengan menggunakan teknik filter, yaitu pemilihan sekumpulan kata yang berpengaruh terhadap penentuan pelabelan yang dilakukan pada tahap prapemrosesan data. Tujuan penelitian ini adalah membandingkan performa kinerja klasifikasi dan waktu komputasi model Bernoulli Naive Bayes sebelum dan setelah menerapkan metode pemilihan fitur dengan teknik filter, serta membandingkan performa kinerja klasifikasi dan waktu komputasi metode pemilihan fitur jenis supervised feature selection pada algoritme Bernoulli Naive Bayes. Hasil penelitian menunjukkan bahwa performa model seleksi fitur dengan teknik filter tidak lebih baik daripada model tanpa seleksi fitur sehingga teknik filter ini tidak disarankan untuk digunakan pada pengklasifikasian kasus riskan (besar resikonya). Namun dilihat dari waktu komputasi, model seleksi fitur dengan teknik filter memiliki waktu komputasi yang lebih singkat. Hasil perbandingan di antara model seleksi fitur jenis supervised feature selection menunjukkan setiap metode seleksi fitur memiliki perbedaan dalam menentukan fitur yang berpengaruh. Model dengan performa kinerja paling baik dan memiliki waktu komputasi yang paling singkat pada Bernoulli Naive Bayes adalah SU, sementara model dengan performa kinerja paling rendah dan tidak efisien dari segi waktu komputasi adalah EOR.
      URI
      http://repository.ipb.ac.id/handle/123456789/104417
      Collections
      • UT - Statistics and Data Sciences [2260]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository