Penggunaan Metode Random Forest untuk Menentukan Status Keberhasilan Siswa dalam Ujian Nasional Berbasis Komputer (UNBK)
Abstract
Ujian nasional merupakan kontrol kualitas pemerataan pendidikan secara nasional. Ujian Nasional Berbasis Komputer (UNBK) merupakan salah satu terobosan baru agar pelaksanaan ujian nasional lebih efisien, meningkatkan mutu, fleksibilitas, dan kehandalan ujian nasional. UNBK tidak diadakan lagi, walaupun demikian diharapkan dengan penelitian ini dapat memberikan manfaat atau evaluasi bagi pemerintah dalam meningkatkan mutu pendidikan di Indonesia. Oleh karena itu, penelitian ini bertujuan untuk mengetahui faktor yang berperan penting dalam menentukan status keberhasilan siswa dengan menggunakan metode random forest. Data yang digunakan adalah data survei angket siswa SMA yang diperoleh dari Pusat Pendidikan (Puspendik) Kementerian Pendidikan dan Kebudayaan (Kemendikbud) tahun 2018. Penanganan data tidak seimbang dilakukan menggunakan Synthetic Minority Oversampling Technique (SMOTE). Metode random forest menghasilkan nilai rata-rata akurasi, area under curve (AUC), sensitivitas dan spesifisitas yang tinggi. Hal tersebut menunjukkan bahwa penerapan random forest pada data memberikan kinerja yang baik. Penerapan random forest menghasilkan lima faktor penting yang menentukan status keberhasilan siswa dalam UNBK yaitu (1) penggunaan internet dalam satu minggu, (2) pendidikan terakhir ayah, (3) pendidikan terakhir ibu, (4) gaji orang tua perbulan dan (5) keikutsertaan tryout UNBK. National Examination is a quality control for the equity of national education. Computer Based Test (CBT) is a new breakthrough of the efficient national examination, and increasing the quality, flexibility and reliability. Even though CBT is no longer existed, it is hoped that this research can provide benefits or evaluation for government in improving quality of education in Indonesia. Therefore, this research aims to find the factors that take an important role in determing the success status of students using the random forest method. The data used is senior high school student questionnaire survey data obtained from the Education Center (Puspendik) of Ministry of Education and Culture (Kemendikbud) in 2018. Unbalanced data handling is carried out using Synthetic Minority Oversampling Technique (SMOTE). The random forest method produce high average value of accuracy, area under curve (AUC), sensitivity, specificity. It means that the application of random forest provides a good performance and produces five important factors that determine the success status of students in CBT, those are (1) internet usage in one week, (2) father’s latest education, (3) mother’s latest education, (4) parent’s monthly income and (5) student’s participation in CBT tryout.