Title: Identifikasi Karakteristik Rumah Tangga Penerima Bantuan Sosial Menggunakan Metode Feature Importance Model Berbasis Pohon Klasifikasi.
Other Titles: Identification of Household Characteristics of Social Assistance Recipients Using the Feature Importance Model Based on Classification Tree
Authors: Sartono, Bagus
Syafitri, Utami Dyah
Zendrato, Nofrida Elly
Issue Date: 24-Aug-2022
Publisher: IPB University
Citation: Indonesian Journal of Artificial Intelligence and Data Mining (IJAIDM) Predatech UIN Sultan Kasim Riau Volume 5 Nomor 1 2022, pp. 54-64
Series/Report no.: 10.24014/ijaidm.v5i1.18579;
Abstract: Salah satu cara yang dilakukan pemerintah dalam menekan kemiskinan adalah pemberian program perlindungan sosial yang ditujukan kepada rumah tangga yang membutuhkan. Menurut Permensos No.3 Tahun 2021, penerima program perlindungan sosial diatur dalam Data Terpadu Kesejahteraan Sosial (DTKS) yang berisi data pemerlu pelayanan kesejahteraan sosial, penerima bantuan dan pemberdayaan sosial, serta potensi dan sumber kesejahteraan sosial. Target penerima bantuan erat kaitannya dengan kemiskinan. Badan Pusat Statistik mengukur kemiskinan dengan menggunakan konsep pemenuhan kebutuhan dasar baik makanan maupun non makanan dari sisi pengeluaran. Penelitian ini dilakukan untuk (i) menyusun model klasifikasi optimal status rumah tangga penerimaan bantuan sosial, (ii) memperoleh peubah-peubah penting status rumah tangga penerimaan bantuan sosial, (iii) mengidentifikasi karakteristik rumah tangga penerima bantuan sosial dari pemerintah. Model klasifikasi dengan teknik random forest dibentuk tanpa penanganan ketidakseimbangan kelas data dan dengan penanganan ketidakseimbangan data, kemudian dibandingkan kinerja modelnya. Penanganan ketidakseimbangan data dilakukan dengan menggunakan teknik Synthetic Minority Oversampling Techinique (SMOTE) pada data latih. Hasil klasifikasi status rumah tangga penerimaan bantuan sosial dengan menggunakan random forest dengan SMOTE memiliki kinerja yang lebih baik dibandingkan model random forest tanpa SMOTE. Hasil dari Permutation Feature Importance adalah peubah pengeluaran per kapita, pendidikan kepala rumah tangga, usia kepala rumah tangga, sumber air minum, luas lantai, pengeluaran total, jumlah anggota rumah tangga dan status daerah merupakan peubah penting. Peubah penting hasil dari SHAP (Shapley Additive Explanations) adalah pendidikan kepala rumah tangga, pengeluaran per kapita, jenis dinding, kepemilikan AC, sumber air minum, usia kepala rumah tangga, luas lantai dan jumlah anggota rumah tangga. Peubah penting hasil dari Permutation Feature Importance dan SHAP yang konsisten berada pada peringkat teratas, dan memiliki perbedaan skor/peringkat terkecil dari kedua metode dijadikan sebagai peubah penting yang terpenting. Peubah tersebut adalah pengeluaran per kapita, pendidikan kepala rumah tangga, usia kepala rumah tangga, sumber air minum, luas lantai dan jumlah anggota rumah tangga. Pohon klasifikasi menunjukkan karakteristik rumah tangga penerima bantuan sosial yaitu pendidikan kepala rumah tangga adalah maksimal SD/sederajat, sumber air minumnya sumur terlindung/tak terlindung, mata air terlindung/tak terlindung, air permukaan (sungai/danau/waduk/kolam/irigasi, air hujan) dan leding, pengeluaran per kapita di bawah rata-rata pengeluaran per kapita Provinsi Banten tahun 2021, jumlah tanggungan besar yaitu anggota rumah tangga lebih dari empat orang, usia kepala rumah tangga antara 45 – 59 tahun, dan luas lantai rumah termasuk tidak layak huni.
One way the government reduces poverty is to provide social protection programs for needy households. According to the Minister of Social Affairs Regulation No. 3 of 2021, recipients of social protection programs are regulated in the Integrated Social Welfare Data (ISWD). ISWD contains data on the need for social welfare services, recipients of social assistance and empowerment, and potential sources of social welfare. Target recipients of the program are closely related to poverty. Statistics Indonesia measures poverty by basic needs approach, both food and non-food from the expenditure side. This study was conducted to (i) develop an optimal classification model for the status of households receiving social assistance, (ii) to obtain important variables for the status of households receiving assistance, and (iii) to identify the characteristics of households receiving social assistance from the government based on their homes. The data imbalance is done by using the Synthetic Minority Oversampling Technique (SMOTE) technique on the training data before building the classification model. The results of the classification of the status of households receiving social protection programs using random forest have a reasonably good performance. Permutation Feature Importance results are per capita expenditure, education of the head of the household, age of the head of the household, source of drinking water, floor area, total expenditure, number of household members, and regional status important variables. The important variables resulting from the Shapley Additive Explanations are the education of the head of the household, per capita expenditure, type of wall, AC ownership, drinking water source, age of the head of the household, floor area, and the number of household members. The important variables resulting from the PFI and SHAP, which are consistently in the top ranking, are the most important variables. The variables are expenditure per capita, education of the head of the household, age of the head, source of drinking water, floor area, and the number of household members. The classification trees shows that the characteristics of households receiving social assistance are education of the head of the household is a maximum of primary school/equivalent, sources of drinking water namely protected/unprotected wells, protected/unprotected springs, surface water (rivers/lakes/reservoirs/ ponds/irrigation, rain), per capita expenditure is below the average per capita expenditure of Banten Province, floor area is unlivable, the number of household members is at least four people, and age of the head of the household is 45 – 59 years.
ISSN: 2614-3372
