Analisis Sentimen Twitter dengan Klasifikasi Naïve Bayes menggunakan Seleksi Fitur Mutual Information dan Inverse Document Frequency
Abstract
Penelitian ini bertujuan untuk mengklasifikasi data tweet pada Twitter
menjadi 3 sentimen yaitu positif, negatif, dan netral. Data yang digunakan dalam
penelitian ini sebanyak 3195 yang terdiri atas 1065 tweet positif, 1065 tweet
negatif, dan 1065 tweet netral. Data dibagi menjadi dua subset data yang terdiri
atas 80% data latih dan 20% data uji. Data latih akan digunakan dalam tahapan
seleksi fitur dengan melakukan 5 kali percobaan sementara data uji digunakan
untuk melakukan pengujian terhadap sistem klasifikasi yang telah dibuat dengan
menggunakan metode Multinomial Naïve Bayes. Penelitian ini menghasilkan nilai
rata-rata akurasi sebesar 71.89% untuk seleksi fitur Mutual Information dan
60.67% untuk seleksi fitur Inverse Document Frequency. Adapun nilai rata-rata
akurasi tiap sentimennya untuk Mutual Information dan Inverse Document
Frequency masing-masing yaitu 65.07% dan 50.33% untuk sentimen positif,
69.86% dan 50.52% untuk sentiment negatif, 80.84% dan 80.75% untuk sentimen
netral.
Collections
- UT - Computer Science [2335]