Perbandingan Kinerja Random Forest dan Double Random Forest untuk Klasifikasi Status Kemiskinan di Level Kabupaten/Kota

Hidayatulloh, Nabila Ghoni Trisno

View/Open

Cover (856.1Kb)

Fullteks (3.362Mb)

Lampiran (801.0Kb)

Date

2022

Author

Hidayatulloh, Nabila Ghoni Trisno

Notodiputro, Khairil Anwar

Angraini, Yenni

Metadata

Show full item record

Abstract

Prediksi berdasarkan sebuah model baik untuk dilakukan karena dapat menghasilkan prediksi yang akurat. Salah satu model yang sudah banyak digunakan dalam memprediksi adalah model klasifikasi Random Forest. Namun, ukuran minimum nodesize pada random forest mungkin kurang optimal untuk menghasilkan kinerja model yang terbaik. Double Random Forest mengatasi hal tersebut dengan membentuk pohon yang lebih besar. Penelitian ini ingin membandingkan kinerja model klasifikasi random forest dan double random forest dalam memprediksi status kemiskinan rumah tangga di Jawa Barat pada tahun 2019. Jumlah penduduk miskin yang bernilai sangat kecil dibandingkan jumlah seluruh penduduk di suatu wilayah menyebabkan adanya ketidakseimbangan pada data. Salah satu langkah penanganan yang dapat dilakukan adalah dengan menggunakan teknik SMOTE. Kinerja metode random forest dan double random forest tidak menunjukkan hasil yang berbeda dalam memprediksi status kemiskinan rumah tangga di Jawa Barat. Hal ini dikarenakan ukuran pohon yang dihasilkan random forest sudah dinilai cukup untuk memberikan kinerja model terbaik sehingga tidak diperlukan adanya perbaikan dengan double random forest. Berdasarkan model-model yang terbentuk, jumlah anggota rumah tangga (ART) merupakan peubah paling penting saat memprediksi rumah tangga miskin di Jawa Barat.

Predictive modeling leads to more accurate prediction therefore good to be used. One of model that has been widely used in prediction is Random Forest classification model. However minimum nodesize in random forest is not optimal enough to produce the best model performance, so Double Random Forest overcome this issue by forming bigger trees. This study aims to compare the performance of random forest and double random forest classification models in predicting poverty status of households in West Java at 2019. The number of people living in poverty is very small compared to total population in certain area. This causes an imbalance class in the data. One way that can be done to overcome imbalance class is by using SMOTE technique. Performance of random forest and double random forest methods did not show different result in predicting poverty status of households in West Java. This is due to size of the trees produced by random forest that considered good enough to provide best model, so there is no room for improvement with double random forest. Based on the models, age of the householder showing as the most important variable in classifying household poverty status in West Java.

URI

http://repository.ipb.ac.id/handle/123456789/113215

Collections

UT - Statistics and Data Sciences [2260]