Analisis Hoax Menggunakan Seleksi Fitur Chi Square dengan Relevance Feedback
Abstract
Hoax merupakan informasi tidak benar dan berbahaya karena dapat merubah
persepsi seseorang dengan menyampaikan informasi palsu sebagai kebenaran dan
dapat mengurangi kredibilitas. Pembelajaran mesin dapat digunakan untuk
menganalisa sebuah berita merupakan hoax atau non hoax. Penelitian ini bertujuan
untuk mengklasifikasikan berita hoax menggunakan 600 dokumen berita yang
terdiri dari 300 berita hoax dan 300 berita non hoax. Data latih dan data uji dibagi
berdasarkan pengujian metode 10-fold cross validation lalu menggunakan seleksi
fitur Chi Square yang akan dibandingkan dengan Inverse Document Frequency
dengan klasifikasi Multinomial Naïve Bayes dan menggunakan Incremental Naïve
Bayes untuk menghitung nilai Relevance Feedback. Penelitian ini menghasilkan
nilai rata-rata akurasi yang cukup baik yaitu sebesar 94.5% untuk seleksi fitur Chi
Square dan 83.5% untuk IDF. Setelah menggunakan Relevance Feedback rata-rata
akurasi bertambah menjadi 97.5% untuk seleksi fitur Chi Square dan 97% untuk
seleksi fitur Inverse Document Frequency.
Collections
- UT - Computer Science [2335]