Penerapan Regresi Logistik Biner dan CHAID pada Data Tidak Seimbang (Studi Kasus: Klasifikasi Status Kemiskinan di Provinsi NTT).
View/ Open
Date
2019Author
Hanifah, Zahra
Silvianti, Pika
Mattjik, Ahmad Ansori
Metadata
Show full item recordAbstract
Jumlah penduduk miskin di Nusa Tenggara Timur sebesar 21.38% dari penduduknya. Klasifikasi rumah tangga miskin dan tidak miskin perlu dilakukan agar program pemerintah dalam mengentas kemiskinan diterima oleh rumah tangga yang layak. Klasifikasi dapat dilakukan dengan menggunakan karakteristik yang menggambarkan tingkat kesejahteraan suatu rumah tangga. Metode klasifikasi yang dapat dilakukan adalah regresi logistik biner dan chi-square automatic interaction detector (CHAID). Namun, dalam proses klasifikasi sering ditemui masalah data tidak seimbang. Data tidak seimbang akan berdampak pada model klasifikasi yang terbentuk. Metode resampling akan digunakan untuk menangani masalah ini. Pemodelan dengan analisis regresi logistik biner dan CHAID setelah menggunakan metode resampling menghasilkan persentase spesifisitas dan akurasi klasifikasi yang lebih kecil dibandingkan tanpa resampling. Meskipun demikian, metode resampling menghasilkan nilai AUC dan persentase sensitivitas yang lebih besar, sensitivitas yang lebih besar menunjukkan model dengan menggunakan metode resampling lebih baik dalam mengklasifikasikan rumah tangga miskin dengan benar
