Klasifikasi Sekolah pada Penerimaan Mahasiswa Baru Jalur SNMPTN di IPB University Menggunakan Metode Regresi Logistik Multinomial
Abstract
IPB University merupakan perguruan tinggi yang memiliki kualitas pendidikan baik, begitu pula dengan penerimaan mahasiswa barunya. Salah satu jalur penerimaan mahasiswa baru yang ada di IPB University yaitu SNMPTN. Hal yang ingin diketahui IPB University adalah membuat fungsi klasifikasi sekolah pendaftar SNMPTN menggunakan metode regresi logistik multinomial. Sebelum dilakukan klasifikasi, dilakukan analisis gerombol dengan metode two-step cluster menggunakan data tahun 2016-2020. Metode two-step cluster menghasilkan empat gerombol optimal. Gerombol 1 adalah sekolah dengan peringkat terendah (komitmen, kualitas, dan konsistensi rendah). Gerombol 2 dan 3 adalah sekolah yang memiliki kriteria khusus pada kategori tertentu. Gerombol 4 adalah sekolah yang memiliki peringkat tertinggi (komitmen, kualitas, dan konsistensi tinggi). Hasil dari analisis gerombol akan dipakai untuk klasifikasi sebagai peubah respon. Model regresi logistik multinomial memberikan ketepatan klasifikasi sebesar 98,86%. Peluang sekolah setiap kategori dapat diperoleh dari model logit yang terbentuk. Peubah signifikan dari model yang dihasilkan mampu memprediksi peluang sekolah untuk masuk dalam gerombol tertentu. Model yang didapatkan dari hasil klasifikasi akan divalidasi menggunakan data tahun 2021. Validasi yang dihasilkan masih belum cukup bagus memprediksi karena nilai akurasinya sebesar 61,8%. Nilai akurasi dikatakan bagus jika berada pada selang 80-110%. Hal ini dikarenakan setiap tahun terjadi perubahan sekolah yang mendaftar SNMPTN di IPB University. IPB University is considered as one of the best universities, with quite qualified student enrollment. One of the new student admissions paths at IPB University is SNMPTN. This study aimed to generate a classification function for the school of college student enrollment, in this case, SNMPTN on IPB University, with a multinomial logistic regression analysis method. The researcher conducted the cluster analysis by two-step cluster using 2016 until 2020 data and produced four optimal clusters. The clustering was proceed and resulted four optimal clusters. The first cluster ranked lowest based on commitment, quality, and high school student enrollment consistency. The second and third clusters were schools with particular criteria for specific categories. The last cluster was the other three clusters highest commitment, quality, and consistency. In this case, the multinomial logistic regression model had 98,86% accuracy. The probability of all clusters in a high school could be derived from the logit model. Logistic regression's coefficient was used to predict probability value which falls into four clusters model. The prediction model of the actual data on years interval 2016 until 2020 for data testing 2021 was still below expectation because low accuracy data was 61,8%.