Penerapan Metode Filter Feature Selection untuk Menentukan Subset Peubah Terbaik dalam Pemodelan Kejadian Rawan Pangan di Jawa Barat
View/ Open
Date
2023Author
Aisyah, Usthuanah
Masjkur, Mohammad
Sartono, Bagus
Metadata
Show full item recordAbstract
Seleksi peubah berguna untuk memilih subset peubah yang revelan terhadap peubah respon, dan seleksi peubah dapat diterapkan untuk mengetahui peringkat peubah yang berhubungan erat dengan suatu kejadian, salah satunya rawan pangan. Penelitian ini bertujuan menyaring peubah yang berhubungan erat dengan kejadian rawan pangan di Jawa Barat berdasarkan algoritme filter univariat information gain, gain ratio, symmetrical uncertainty, gini gain, dan chi-square serta mengidentifikasi subset peubah terbaik berdasarkan model klasifikasi yang menghasilkan ukuran kinerja paling baik menggunakan algoritme klasifikasi Xtreme Gradient Boosting (XGBoost). Hasil penelitian menunjukkan status kepemilikan kulkas, komputer, emas minimal 10 gram, dan televisi layar datar minimal 30 inch merupakan peubah yang konsisten terpilih pada semua algoritme filter univariat tersebut. Pemodelan klasifikasi XGBoost dengan subset peubah terpilih gain ratio menghasilkan nilai sensitivitas dan spesifisitas yang seimbang sebesar 61,9% dan 61,4%. Hasil penyaringan peubah gain ratio mengindikasikan bahwa rumah tangga yang tidak memiliki modal ekonomi berupa emas minimal 10 gram, komputer, kulkas, televisi layar datar minimal 30 inch dan rumah tangga penerima Bantuan Pangan Nontunai (BPNT) cenderung rawan pangan. Feature selection is useful for selecting a subset of variables relevant to the response variable, and it can be applied to determine the rank of variables closely related to an incident, one of which is food insecurity. This study aims to select variables closely related to food insecurity in West Java based on information gain, gain ration, symmetrical uncertainty, gini gain, and chi-square univariate filter algorithms and identify the best subset of variables based on the classification model that produces the best performance measures using the Xtreme Gradient Boosting (XGBoost) algorithm. The study result shows that the ownership status of a refrigerator, a computer, a gold of at least 10 grams, and a flat-screen television of at least 30 inches are the consistent variables selected on all the univariate filter algorithms. XGBoost classification modeling with the subset of selected variables gain ratio has balanced sensitivity and specificity values of 61,9% and 61,4%. The gain ratio variables filtering result indicates that households that do not have economic capital in the form of gold at least 10 grams, computer, refrigerator, flat-screen television at least 30 inches, and households receiving Non-Cash Food Aid (BPNT) tend to be food insecure.