Analisis Sentimen dan Pemodelan Topik pada Saran EPBM IPB Menggunakan CNN dan BERTopic
Abstract
Saran mahasiswa dalam Evaluasi Proses Pembelajaran (EPBM) di Universitas IPB mengandung wawasan berharga untuk meningkatkan kualitas akademik. Namun, volume data yang besar dan konten yang beragam membuat analisis manual menjadi tidak efisien dan rentan terhadap bias. Masalah utama terletak pada kebutuhan untuk secara otomatis dan akurat mengklasifikasikan sentimen serta mengidentifikasi topik kunci dari data.
Penelitian ini bertujuan untuk melakukan klasifikasi sentimen dan pemodelan topik untuk saran EPBM. Data terdiri dari umpan balik mahasiswa yang dikumpulkan dari tahun akademik 2022/2023 hingga 2024/2025 melalui Portal Mahasiswa IPB. Tahapan praproses meliputi pembersihan data, case folding, tokenization, normalization, dan penghapusan stopword. Setelah pelabelan manual, data dibagi menjadi tiga kelas sentimen, yaitu positif (1.184 teks), negatif (515 teks), dan netral (521 teks). Data kemudian dibagi menjadi data pelatihan, validasi, dan pengujian, serta diseimbangkan menggunakan Random Oversampling. Representasi kata dilakukan menggunakan contextual embeddings yang dihasilkan oleh IndoBERT sebagai inputan awal pada Convolutional Neural Network (CNN). Saran EPBM dapat mengandung kalimat yang sangat panjang karena itu perpaduan IndoBERT dengan teknik convolutional dapat menghasilkan representasi yang representatif dari kalimat panjang tersebut. Penelitian ini menggunakan arsitektur Parallel CNN dengan dua kali lapisan konvolusional untuk klasifikasi sentimen. Pemodelan topik dilakukan menggunakan BERTopic untuk mengekstrak tema dominan dari saran positif dan negatif.
Berdasarkan hasil pengujian, Parallel CNN dapat mengklasifikasikan sentimen pada saran EPBM dengan sangat baik, yaitu mencapai akurasi tertinggi sebesar 96% yang menunjukkan generalisasi yang sangat baik di semua kategori sentimen. BERTopic mengidentifikasi empat topik utama dari 1.709 saran negatif dan empat topik dari 3.506 saran positif dengan skor masing-masing 0,4145 dan 0,4945. Topik yang diekstraksi mencerminkan harapan mahasiswa akan pembelajaran yang komunikatif, menarik, dan efektif didukung oleh penyampaian informasi yang jelas dan infrastruktur teknis yang kokoh. Penelitian ini menunjukkan bahwa kombinasi CNN dan BERTopic menyediakan pendekatan efisien dan informatif untuk menganalisis saran mahasiswa, menawarkan wawasan berbasis data untuk perbaikan akademik.
