Penerapan Resampling pada Random Forest untuk Mengklasifikasikan Status Kebutuhan KB
View/ Open
Date
2020Author
Shiddiq, Halimah Mardhiyah Mu’min
Silvianti, Pika
Masjkur, Mohammad
Metadata
Show full item recordAbstract
Jumlah penduduk Indonesia mengalami peningkatan yang cukup pesat sekitar
3.5−4 juta jiwa pertahun. Program Keluarga Berencana (KB) dibentuk pada tahun
1970 dengan tujuan untuk menurunkan tingkat kelahiran. Status kebutuhan KB
dikategorikan menjadi dua kelas yaitu KB yang terpenuhi (met need KB) dan KB
yang tidak terpenuhi (unmet need KB). Perbedaan tingkat unmet need KB dan met
need KB menyebabkan ketidakseimbangan pada data. Random forest merupakan
metode klasifikasi pada data kategorik berupa kumpulan pohon keputusan. Tujuan
penelitian ini adalah memperoleh model terbaik dalam mengklasifikasikan status
kebutuhan KB serta mengetahui peubah-peubah yang memengaruhi status
kebutuhan KB berdasarkan random forest dengan resampling pada data tidak
seimbang. Data yang digunakan adalah data SDKI (Survei Demografi dan
Kesehatan Indonesia) BKKBN tahun 2017 yang terdiri atas 16 peubah kategorik.
Penanganan data tidak seimbang dilakukan menggunakan undersampling,
oversampling, dan Synthetic Minority Oversampling Technique (SMOTE). Hasil
penelitian ini menunjukkan bahwa model dengan penerapan SMOTE menghasilkan
F1-score dan AUC-PR tertinggi dalam mengklasifikasi status kebutuhan KB.
Berdasarkan tingkat kepentingan peubah penjelas didapatkan banyak anak hidup,
diskontinu KB dalam 5 tahun terakhir, kelahiran dalam 5 tahun terakhir, keinginan
menambah anak, dan usia istri sebagai peubah penting dalam menentukan status
kebutuhan KB pada pasangan usia subur.