Penerapan Algoritma Genetika dalam Penentuan Pusat Gerombol K-Prototypes (Studi Kasus: Data Mata Kuliah Jenjang S1 IPB University)
Date
2025Author
Ihsan, Alfikri
Syafitri, Utami Dyah
Aidi, Muhammad Nur
Metadata
Show full item recordAbstract
Analisis gerombol merupakan salah satu metode dalam analisis data yang digunakan untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristiknya. Pada umumnya, analisis gerombol banyak digunakan dalam pengelompokan data dengan tipe numerik. Pada kenyataannya, banyak data merupakan gabungan dari data bertipe numerik dan juga kategorik. Algoritma KPrototypes adalah salah satu metode dalam analisis gerombol yang dapat menangani permasalah data campuran. Algoritma ini bekerja dengan cara mengintegrasikan perhitungan jarak pada K-Means dan K-Modes secara bersamaan. Hasil penggerombolan dengan algoritma K-Prototypes cenderung memperoleh solusi yang optimum lokal. Oleh karena itu, pada penelitian dilakukan penggerombolan dengan algoritma K-Prototypes dan mengombinasikannnya dengan algoritma genetika untuk menentukan pusat awal gerombol yang optimal. Pada penelitian ini penggerombolan akan dilakukan untuk mengelompokkan data mata kuliah program S1 IPB University, yang terdiri dari peubah numerik dan peubah kategorik. Hasil dari penelitian ini diperoleh bahwa penerapan algoritma genetika dalam penentuan pusat awal gerombol mampu menghasilkan solusi yang lebih optimal. Hasil dari penggerombolan menunjukkan bahwa terdapat perbedaan dari karakteristik masing-masing mata kuliah dari jenis pembelajaran, durasi pelaksanaan dan juga kapasitas masing-masing mata kuliah. Cluster analysis is data analysis methods used to group data based on similarity in characteristics. Typically, cluster analysis is widely used for grouping numerical data. However, in reality, many datasets consist of a combination of both numerical and categorical data. The K-Prototypes algorithm is a clustering technique that can handle mixed-type data, combining both numerical and categorical variables. It works by integrating the distance measures from K-Means and K-Modes simultaneously. However, the solutions generated by the KPrototypes algorithm tend to result in local optimum solutions. Therefore, this study aims to use the K-Prototypes algorithm optimized with a Genetic Algorithm (GA) to determine the cluster center points, ensuring a global optimum solution. This approach will be applied to cluster the undergraduate course data at IPB University, which includes both numerical and categorical variables. The results of this study indicate that the genetic algorithm can optimize the performance of K-Prototypes by determining optimal initial cluster centers. The clustering results indicate clear variaton in the course structure at the university, related to the specific needs of each faculty, the type of learning (practical vs. theoretical), as well as the intensity of the courses (long vs. short duration).
