Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/162543
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorWijaya, Sony Hartono-
dc.contributor.advisorSyafitri, Utami Dyah-
dc.contributor.authorMuthahari, Wadudi-
dc.date.accessioned2025-06-17T13:23:27Z-
dc.date.available2025-06-17T13:23:27Z-
dc.date.issued2025-
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/162543-
dc.description.abstractInstitut Pertanian Bogor (IPB) merupakan institusi pendidikan yang berperan penting dalam pembangunan sumberdaya manusia, salah satunya dengan melakukan seleksi penerimaan mahasiswa baru melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN). SNMPTN merupakan pola seleksi berdasarkan potensi akademik pelamar selama di sekolah pada masing-masing Perguruan Tinggi Negeri (PTN) di bawah koordinasi Lembaga Tes Masuk Perguruan Tinggi (LTMPT). Sejak tahun 2019, proses seleksi di IPB menggunakan media seleksi berbasis web dan algoritma tertentu. Pemodelan berbasis machine learning dapat diterapkan untuk mempercepat proses seleksi dengan memberikan rekomendasi apakah siswa yang mendaftar layak diterima atau tidak sebagai mahasiswa IPB. Setiap tahun data pelamar yang lulus dan tidak lulus selalu memiliki ketidakseimbangan karena pelamar yang lulus jauh lebih sedikit dibandingkan dengan jumlah pelamar yang tidak lulus. Teknik penyeimbangan data yang dilakukan adalah Synthetic Minority Oversampling Technique (SMOTE). Penelitian ini bertujuan mengembangkan pemodelan machine learning menggunakan Random Forest (RF) dan Regresi Logistik Biner (RLB) pada sistem seleksi SNMPTN IPB dan mencari faktor-faktor apa saja yang mempengaruhi kelulusan calon mahasiswa jalur SNMPTN IPB. Penelitian ini menggunakan data SNMPTN 2021 sebagai data latih dan SNMPTN 2022 sebagai data uji. Sebanyak empat skenario pemodelan diterapkan pada masing-masing metode dan wilayah. Semua model dilatih menggunakan hyperparameter tuning. Model kesatu menggunakan semua fitur dan tanpa penyeimbangan. Model kedua menggunakan semua fitur dan SMOTE. Model ketiga menggunakan seleksi fitur dan SMOTE serta model keempat dengan pemilihan fitur by Adjustment Pakar (AP) dan SMOTE. Fokus utama dalam pemodelan dan pengujian adalah memaksimalkan deteksi pelamar yang lulus, sehingga nilai recall yang tinggi menjadi acuan dalam pengambilan model terbaik. Hasil pengujian menunjukkan bahwa model yang diuji menggunakan data uji dengan penyeimbangan data SMOTE secara konsisten menunjukkan nilai recall yang lebih tinggi dibandingkan dengan model tanpa penyeimbangan data. Model ketiga dengan Regresi Logistik Biner pada data Jawa Barat dan model kedua dengan Regresi Logistik Biner pada data Non Jawa Barat menunjukkan nilai recall terbaik sebesar 88,93% dan 86,91%. Hasil pemodelan juga menunjukkan bahwa urutan pemilihan perguruan tinggi, indeks sekolah, pilihan program studi, dan prestasi memiliki pengaruh signifikan terhadap prediksi kelulusan pelamar.-
dc.description.abstractIPB University is an educational institution that plays a vital role in human resource development, one of which is by conducting new student admission selection through the SNMPTN pathway. SNMPTN is a selection pattern based on the academic potential of applicants while at school at each State University (PTN) under the coordination of the Higher Education Entrance Test Institute (LTMPT). Since 2019, the selection process at IPB has used web-based selection media and specific algorithms. Machine learning-based modeling can be utilized to streamline the selection process by providing recommendations on the eligibility of applicants for admission as students at IPB. Every year, the data on applicants who pass and fail always shows an imbalance, as the number of applicants who pass is significantly smaller than the number of applicants who fail. The data balancing technique used is the Synthetic Minority Oversampling Technique (SMOTE). This study aims to develop machine learning models using Random Forest (RF) and Binary Logistic Regression (BLR) in the IPB SNMPTN selection system and identify the factors that influence the graduation of prospective students through the IPB SNMPTN pathway. The research uses SNMPTN 2021 data as training data and SNMPTN 2022 as test data. There are four models built. All models are trained using hyperparameter tuning. The first model uses all features without balancing. The second model uses all features and SMOTE. The third model utilizes feature selection and SMOTE, while the fourth model employs feature selection via Expert Adjustment (EA) and SMOTE. The primary focus in modeling and testing is to maximize the detection of successful applicants, so that high recall values are used as a reference in selecting the best model. The test results show that models tested using test data with SMOTE data balancing consistently yield higher recall values compared to models without data balancing. The third model, with Binary Logistic Regression applied to West Java data, and the second model, with Binary Logistic Regression applied to Non-West Java data, show the best recall values of 88,93% and 86,91%, respectively. The modeling results also show that the order of college selection, school index category, choice of study program, and academic achievement have a significant influence on the prediction of applicants’ passing rates.-
dc.description.sponsorshipnull-
dc.language.isoid-
dc.publisherIPB Universityid
dc.titlePengembangan Model Prediksi Kelulusan Calon Mahasiswa Sarjana pada Sistem Seleksi SNMPTN IPBid
dc.title.alternativeDevelopment of a Graduation Prediction Model for Undergraduate Applicants in the SNMPTN Admission System at IPB University-
dc.typeTesis-
dc.subject.keywordrandom forestid
dc.subject.keywordregresi logistik binerid
dc.subject.keywordSMOTEid
dc.subject.keywordModelid
dc.subject.keywordSNMPTN IPBid
Appears in Collections:MT - School of Data Science, Mathematic and Informatics

Files in This Item:
File Description SizeFormat 
cover_G6501211053_8df09e9aa9a148c894f4e694514f01e5.pdfCover305.49 kBAdobe PDFView/Open
fulltext_G6501211053_74561c2d01224f0a9e2570cfeb6ca7b8.pdf
  Restricted Access
Fulltext6.2 MBAdobe PDFView/Open
lampiran_G6501211053_d5762e7053264d4ab3bb6315e2ecf7a2.pdf
  Restricted Access
Lampiran239.33 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.