Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/162543| Title: | Pengembangan Model Prediksi Kelulusan Calon Mahasiswa Sarjana pada Sistem Seleksi SNMPTN IPB |
| Other Titles: | Development of a Graduation Prediction Model for Undergraduate Applicants in the SNMPTN Admission System at IPB University |
| Authors: | Wijaya, Sony Hartono Syafitri, Utami Dyah Muthahari, Wadudi |
| Issue Date: | 2025 |
| Publisher: | IPB University |
| Abstract: | Institut Pertanian Bogor (IPB) merupakan institusi pendidikan yang berperan
penting dalam pembangunan sumberdaya manusia, salah satunya dengan
melakukan seleksi penerimaan mahasiswa baru melalui jalur Seleksi Nasional
Masuk Perguruan Tinggi Negeri (SNMPTN). SNMPTN merupakan pola seleksi
berdasarkan potensi akademik pelamar selama di sekolah pada masing-masing
Perguruan Tinggi Negeri (PTN) di bawah koordinasi Lembaga Tes Masuk
Perguruan Tinggi (LTMPT). Sejak tahun 2019, proses seleksi di IPB menggunakan
media seleksi berbasis web dan algoritma tertentu. Pemodelan berbasis machine
learning dapat diterapkan untuk mempercepat proses seleksi dengan memberikan
rekomendasi apakah siswa yang mendaftar layak diterima atau tidak sebagai
mahasiswa IPB. Setiap tahun data pelamar yang lulus dan tidak lulus selalu
memiliki ketidakseimbangan karena pelamar yang lulus jauh lebih sedikit
dibandingkan dengan jumlah pelamar yang tidak lulus. Teknik penyeimbangan data
yang dilakukan adalah Synthetic Minority Oversampling Technique (SMOTE).
Penelitian ini bertujuan mengembangkan pemodelan machine learning
menggunakan Random Forest (RF) dan Regresi Logistik Biner (RLB) pada sistem
seleksi SNMPTN IPB dan mencari faktor-faktor apa saja yang mempengaruhi
kelulusan calon mahasiswa jalur SNMPTN IPB.
Penelitian ini menggunakan data SNMPTN 2021 sebagai data latih dan
SNMPTN 2022 sebagai data uji. Sebanyak empat skenario pemodelan diterapkan
pada masing-masing metode dan wilayah. Semua model dilatih menggunakan
hyperparameter tuning. Model kesatu menggunakan semua fitur dan tanpa
penyeimbangan. Model kedua menggunakan semua fitur dan SMOTE. Model
ketiga menggunakan seleksi fitur dan SMOTE serta model keempat dengan
pemilihan fitur by Adjustment Pakar (AP) dan SMOTE. Fokus utama dalam
pemodelan dan pengujian adalah memaksimalkan deteksi pelamar yang lulus,
sehingga nilai recall yang tinggi menjadi acuan dalam pengambilan model terbaik.
Hasil pengujian menunjukkan bahwa model yang diuji menggunakan data uji
dengan penyeimbangan data SMOTE secara konsisten menunjukkan nilai recall
yang lebih tinggi dibandingkan dengan model tanpa penyeimbangan data. Model
ketiga dengan Regresi Logistik Biner pada data Jawa Barat dan model kedua
dengan Regresi Logistik Biner pada data Non Jawa Barat menunjukkan nilai recall
terbaik sebesar 88,93% dan 86,91%. Hasil pemodelan juga menunjukkan bahwa
urutan pemilihan perguruan tinggi, indeks sekolah, pilihan program studi, dan
prestasi memiliki pengaruh signifikan terhadap prediksi kelulusan pelamar. IPB University is an educational institution that plays a vital role in human resource development, one of which is by conducting new student admission selection through the SNMPTN pathway. SNMPTN is a selection pattern based on the academic potential of applicants while at school at each State University (PTN) under the coordination of the Higher Education Entrance Test Institute (LTMPT). Since 2019, the selection process at IPB has used web-based selection media and specific algorithms. Machine learning-based modeling can be utilized to streamline the selection process by providing recommendations on the eligibility of applicants for admission as students at IPB. Every year, the data on applicants who pass and fail always shows an imbalance, as the number of applicants who pass is significantly smaller than the number of applicants who fail. The data balancing technique used is the Synthetic Minority Oversampling Technique (SMOTE). This study aims to develop machine learning models using Random Forest (RF) and Binary Logistic Regression (BLR) in the IPB SNMPTN selection system and identify the factors that influence the graduation of prospective students through the IPB SNMPTN pathway. The research uses SNMPTN 2021 data as training data and SNMPTN 2022 as test data. There are four models built. All models are trained using hyperparameter tuning. The first model uses all features without balancing. The second model uses all features and SMOTE. The third model utilizes feature selection and SMOTE, while the fourth model employs feature selection via Expert Adjustment (EA) and SMOTE. The primary focus in modeling and testing is to maximize the detection of successful applicants, so that high recall values are used as a reference in selecting the best model. The test results show that models tested using test data with SMOTE data balancing consistently yield higher recall values compared to models without data balancing. The third model, with Binary Logistic Regression applied to West Java data, and the second model, with Binary Logistic Regression applied to Non-West Java data, show the best recall values of 88,93% and 86,91%, respectively. The modeling results also show that the order of college selection, school index category, choice of study program, and academic achievement have a significant influence on the prediction of applicants’ passing rates. |
| URI: | http://repository.ipb.ac.id/handle/123456789/162543 |
| Appears in Collections: | MT - School of Data Science, Mathematic and Informatics |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| cover_G6501211053_8df09e9aa9a148c894f4e694514f01e5.pdf | Cover | 305.49 kB | Adobe PDF | View/Open |
| fulltext_G6501211053_74561c2d01224f0a9e2570cfeb6ca7b8.pdf Restricted Access | Fulltext | 6.2 MB | Adobe PDF | View/Open |
| lampiran_G6501211053_d5762e7053264d4ab3bb6315e2ecf7a2.pdf Restricted Access | Lampiran | 239.33 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.