Pemodelan Klasifikasi Keterlambatan Pembayaran UKT Mahasiswa IPB dengan Random Forest dan AdaBoost
Abstract
Menurut data yang diperoleh dari data Direktorat Keuangan dan Akutansi IPB, terjadi peningkatan jumlah mahasiswa yang mengalami keterlambatan dalam pembayaran UKT di tiap angkatan mulai tahun 2016 sampai dengan 2018 dengan banyak mahasiswa yang mengalami keterlambatan yaitu 54, 64, dan 117 mahasiswa. Penelitian ini bertujuan untuk membandingkan pemodelan klasifikasi menggunakan Random Forest dan AdaBoost serta mengidentifikasi peubah penting yang didapatkan dari pemodelan terbaik. Pemodelan klasifikasi akhir Random Forest menggunakan parameter optimal banyak peubah penjelas sebanyak 7 peubah dan banyak pohon sebanyak 500 pohon dengan penanganan ketidakseimbangan data yaitu Random Oversampling (ROS). Sedangkan pemodelan klasifikasi akhir AdaBoost menggunakan parameter optimal banyak iterasi sebanyak 80 iterasi dengan penanganan ketidakseimbangan data yaitu Random Undersampling (RUS). Pemodelan Random Forest dan AdaBoost memiliki ukuran kinerja prediksi ROC-AUC masing-masing sebesar 58,70% dan 52,90%. Pemodelan Random Forest memiliki kinerja prediksi lebih baik dibandingkan dengan AdaBoost dalam memprediksi mahasiswa yang berindikasi akan terlambat dalam pembayaran UKT dengan selisih nilai ROC-AUC sebesar 5,8%. Kemudian, peubah penting yang dihasilkan dari pemodelan Random Forest adalah besar daya listrik, penghasilan ayah, dan jumlah anak dalam keluarga.