Penerapan Support Vector Machine dengan SMOTE untuk Klasifikasi Sentimen Pemberitaan Omnibus Law pada Situs CNNIndonesia.com
Date
2021Author
Hutami, Widiananda Putri
Wijayanto, Hari
Sulvianti, Itasia Dina
Metadata
Show full item recordAbstract
Pencanangan omnibus law menuai pro kontra di masyarakat. Media sudah seharusnya bersikap netral dalam pemberitaannya pada situasi seperti ini. Salah satu media yang masih menjaga netralitas dalam pemberitaannya adalah Detik (Rumata 2017). Detik membawahi beberapa kanal seperti detikNews, detikFinance, dan CNN Indonesia. Pada penelitian ini, akan dikaji netralitas dari media CNN Indonesia sebagai bagian dari Detik berdasarkan kecenderungan sentimen dalam pemberitaan mengenai omnibus law. Analisis sentimen digunakan untuk memeriksa kecenderungan opini pada data judul berita. Dalam melakukan analisis sentimen, diperlukan metode yang menunjang klasifikasi. Metode klasifikasi yang akan digunakan pada penelitian ini adalah Support Vector Machine (SVM). Terdapat ketidakseimbangan data pada tiga kategori sentimen sehingga digunakan metode Synthetic Minority Oversampling Technique (SMOTE) untuk mengatasi ketidakseimbangan tersebut. Omnibus law cenderung diberitakan secara netral oleh situs CNNIndonesia.com. Metode SVM one vs all memiliki hasil klasifikasi yang lebih baik dibandingkan dengan metode one vs one. Penerapan SMOTE hanya memberikan hasil yang sedikit lebih baik daripada klasifikasi data tanpa penerapan SMOTE karena ketidakseimbangan yang terdapat pada data tidak terlalu ekstrim. Pemodelan menggunakan metode one vs all dengan penanganan SMOTE dan pembagian data 90% data latih 10% data uji memberikan hasil klasifikasi terbaik dengan nilai macro average f1-score sebesar 60,33%. The declaration of the omnibus law reaped the pros and cons in the community. In a situation like this, the media should be neutral. One of the media that still maintains neutrality is Detik (Rumata 2017). Detik owns several channels such as detikNews, detikFinance, and CNN Indonesia. In this study, the neutrality of the CNN Indonesia media as part of Detik will be studied based on the tendency of sentiment on the omnibus law-related news. Sentiment analysis is used to examine the trend of opinion on news headlines. In conducting sentiment analysis, a method that supports classification is needed. The classification method that will be used in this research is the Support Vector Machine (SVM). There is an imbalance of data in the three categories of sentiment so that the Synthetic Minority Oversampling Technique (SMOTE) method is used to overcome this imbalance. The omnibus law tends to be reported neutrally by CNNIndonesia.com site. The one vs all method has a better classification result than the one vs one method. The application of SMOTE only gives slightly better results than data classification without the application of SMOTE because the imbalance in the data is not too extreme. Modeling using the one vs all method with SMOTE and distribution of data 90% train data 10% test data gives the best classification results with a macro average f1-score of 60,33%.