Show simple item record

dc.contributor.advisorRidha, Ahmad
dc.contributor.authorAdityawan, Ega
dc.date.accessioned2014-12-18T04:15:42Z
dc.date.available2014-12-18T04:15:42Z
dc.date.issued2014
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/72137
dc.description.abstractPenelitian ini bertujuan untuk mengklasifikasi data tweet menjadi 3 sentimen yaitu positif, negatif, dan netral menggunakan data seimbang. Data yang digunakan terdiri atas 8 entitas berbeda dengan masing-masing entitas setiap sentimennya terdiri atas 80-90 data. Pengklasifikasian data tweet menggunakan metode naïve Bayes dengan Multinomial dan Bernoulli. Sebelum klasifikasi, dilakukan beberapa tahap praproses seperti normalisasi dan pembuangan stopwords. Pengujian dilakukan pada 60 data setiap entitas per sentimennya untuk mendapatkan model terbaik menggunakan 3-fold cross validation. Setelah itu, data yang tersisa pada setiap entitas per sentimennya dianggap menjadi data baru. Data baru tersebut akan dilakukan klasifikasi dengan menggunakan data latih dari model terbaik pada 3-fold cross validation. Hasil klasifikasi pada data baru menunjukkan, metode naïve Bayes memberikan nilai akurasi sebesar 71.09% untuk Multinomial dan 66.42% untuk Bernoulli. Adapun nilai akurasi tiap sentimennya untuk model Multinomial dan Bernoulli masing-masing yaitu 58.62% dan 64.53% untuk sentimen positif, 77.42% dan 65.53% untuk sentimen negatif, 64.40% dan 84.18% untuk sentimen netralen
dc.description.abstractThe purpose of this research is to classify tweet data into 3 sentiments, i.e., positive, negative, and neutral using balanced data. The data consists of 8 different entities where each entity consists of 80-90 tweets for each sentiment. Data classification uses naïve Bayes with Multinomial and Bernoulli method. Before classification, preprocessing includes normalization and stopword removal. Evaluation is conducted on 60 data of each entity per sentiment to get the best model using 3-fold cross validation. After that, the remaining data from previous evaluation is considered to be new data. The new data will be classified using the training data of the best models in the 3-fold cross validation. Classification results on new data shows, that naïve Bayes method gives an accuracy rate of 71.09% and 66.42% for the Multinomial and Bernoulli. The accuracy rate of each sentiment for Multinomial and Bernoulli models respectively are 58.62% and 64.53% and for the positive sentiment, 77.42% and 65.53% for the negative sentiment, 64.40% and 84.18% for the neutral sentiment. Keywords: Balanced Data, Classification, Naïve Bayes, Sentiment Analyst, Twitter.en
dc.language.isoid
dc.publisherBogor Agricultural University (IPB)
dc.titleAnalisis sentimen dengan klasifikasi naïve bayes pada pesan twitter menggunakan data seimbangen
dc.title.alternativeSentiment analysis with naïve bayes classification on twitter data using balanced dataen
dc.typeUndergraduate Thesisen
dc.subject.keywordAnalisis sentimenen
dc.subject.keyworddata seimbangen
dc.subject.keywordklasifikasien
dc.subject.keywordnaïve bayesen
dc.subject.keywordtwitteren


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record