Kajian Empirik Kinerja Algoritma Khusus Partial Distance Strategy (PDS) dan Imputasi.
Abstract
Analisis gerombol merupakan metode eksplorasi untuk mengelompokkan objek-objek yang memiliki karakteristik yang mirip ke dalam satu gerombol. Seperti analisis statistika standar lainnya, analisis gerombol hanya bisa dilakukan pada data set lengkap. Permasalahan yang sering dihadapi dalam kenyataan sehari-hari sering ditemukan data tidak lengkap pada suatu data set. Penggerombolan data tidak lengkap bisa dilakukan dengan melakukan preprocessing terlebih dulu atau menggunakan algoritma khusus. Preprocessing dilakukan dengan imputasi atau marginalisasi. Imputasi merupakan penambahan nilai tertentu terhadap data tidak lengkap sedangkan marginalisasi merupakan penghapusan terhadap data tidak lengkap. Penelitian ini bertujuan untuk mengkaji kinerja penggerombolan data tidak lengkap menggunakan imputasi dan algortima khusus partial distance strategy (PDS) pada data iris dan menerapkannya terhadap data nilai S-1 Pascasarjana Statistika. Hasil penggerombolan data tidak lengkap dari data iris menunjukkan bahwa algoritma khusus PDS lebih baik dibanding imputasi. Penggerombolan terhadap data nilai S-1 Pascasarjana Statistika menghasilkan dua gerombol. Banyaknya gerombol dipilih berdasarkan metode Connectivity, Dunn, dan Silhouette.