Analisis Berita Hoax Menggunakan Klasifikasi Multinomial Naive Bayes dengan Fitur N-Gram.
Abstract
Hoax merupakan informasi yang menyesatkan dan dapat merusak kredibilitas dan citra seseorang. Pembuat hoax biasanya menggunakan ancaman untuk mengajak atau memanipulasi orang lain untuk mencegah melakukan suatu tindakan. Penyebaran berita hoax akan menjadi penghambat untuk pertumbuhan manusia. Salah satu cara yang dapat dilakukan dalam bidang Information Retrieval untuk membedakan berita hoax dan non-hoax adalah dengan klasifikasi teks. Penelitian ini akan menggunakan klasifikasi multinomial naive bayes untuk membedakan berita hoax dan non-hoax. Fitur yang digunakan pada penelitian ini adalah fitur n-gram yang merupakan sekuen kata yang dipotong dari awal sampai akhir dokumen. Fitur n-gram yang digunakan terdiri dari unigram, bigram, dan trigram. Metode yang digunakan untuk menyeleksi fitur adalah idf. Akurasi dari hasil klasifikasi akan dibandingkan berdasarkan n-gram yang digunakan. Nilai idf untuk seleksi fitur yang memungkinkan untuk digunakan adalah 0.13 sebagai batas bawah dan 2.44 sebagai batas atas untuk proses klasifikasi yang menghasilkan rata – rata akurasi sebesar 86.67% untuk unigram, 82.17% untuk bigram, dan 61.67% untuk trigram.
Collections
- UT - Computer Science [2335]