Perbandingan Metode Support Vector Machine dan Regresi Logistik Biner dalam Mendeteksi Unsur Depresi pada Tweets Berbahasa Indonesia.
Abstract
Prevalensi depresi di dunia naik lebih dari delapan kali lipat, dari sekitar 3% pada 2017 menjadi 28% pada tahun 2020. Depresi juga merupakan kontributor utama dari penyebab kematian tertinggi nomor dua di dunia. Kondisi kesehatan mental seseorang dapat dideteksi dari penggunaan media sosial, salah satunya
Twitter dengan memanfaatkan teknik pembelajaran mesin. Support Vector Machine (SVM) menjadi metode yang sangat populer dalam melakukan klasifikasi pembelajaran mesin berbasis teks. Namun, Regresi Logistik juga masih sangat populer dalam melakukan klasifikasi dengan hasil biner. Penelitian ini membandingkan performa model terbaik dari metode SVM dan Regresi Logistik Biner menggunakan data kicauan (tweet) yang dikumpulkan dari Twitter API untuk mendeteksi unsur depresi. Hasil penelitian menunjukkan bahwa model dengan performa terbaik didapatkan dari metode Regresi Logistik Biner pada kombinasi hyperparameter nilai C = 0,1 dan penalty L2. Nilai matriks konfusi akurasi = 0,78, precision = 0,65, recall = 0,67, dan f-1 score = 0,66, lebih tinggi dibandingkan metode SVM.
