Pengelompokan kode program c berdasarkan kemiripan struktur menggunakan metode hierarchical agglomerative clustering
Abstract
Tujuan penelitian ini adalah mengimplementasikan algoritme hierarchical agglomerative clustering untuk membantu pendeteksian penjiplakan pada kode program c secara otomatis dan membandingkan hasil penelitian dengan penelitian sebelumnya menggunakan metode iterasi k-means otomatis dan bisecting k-means. Data yang digunakan dalam penelitian ini sebanyak 386 kode program c yang terdiri atas 4 dataset. Metode yang digunakan single linkage, complete linkage, dan average linkage. Hasil clustering yang dilakukan menunjukkan eksekusi waktu metode single linkage sebesar 1.7220 detik dengan jumlah cluster 14 dan ri sebesar 0.9706, eksekusi waktu metode complete linkage sebesar 1.7500 detik dengan jumlah cluster 10 dan ri sebesar 0.8560, dan eksekusi waktu metode average linkage sebesar 1.7400 detik dengan jumlah cluster 14 dan ri sebesar 0.9546. Hasil penelitian ini menunjukkan adanya perbaikan waktu eksekusi clustering dari penelitian sebelumnya yang menggunakan metode iterasi k-means sebesar 8.41 detik dan metode bisecting k-means sebesar 4.69 detik
Collections
- UT - Computer Science [2323]