Aplikasi Metode TwoStep Cluster pada Ukuran Data Berbeda, Studi Kasus: Data Potensi Desa 2006 untuk Wilayah Jawa Barat.
Abstract
Analisis gerombol dilakukan untuk mengidentifikasi struktur kelompok data sebenarnya dimana masing-masing kelompok memiliki kemiripan tersendiri. Permasalahan yang biasa ditemukan pada analisis gerombol yaitu data yang ada umumnya tidak hanya bertipe kontinu namun juga bertipe kategorik, serta dalam menentukan jumlah gerombol akhir yang dilakukan secara subyektif oleh peneliti. Metode TwoStep Cluster mampu memberi solusi untuk peubah data yang bertipe campuran antara peubah kontinu dan kategorik serta secara otomatis membentuk gerombol yang optimal bagi kebutuhan data yang sangat besar. Penerapan metode TwoStep Cluster dilakukan pada data Podes SE2006 untuk wilayah Jawa Barat yang memiliki ukuran data besar, kemudian dilakukan kembali pada data Bandung yang memiliki ukuran data kecil. Penggerombolan pada data Jawa Barat menghasilkan tiga gerombol yaitu gerombol perkotaan, pedesaan, dan industri. Sedangkan penggerombolan pada data Bandung menghasilkan dua gerombol yaitu gerombol perkotaan dan pedesaan. Terbentuknya gerombol yang berbeda pada data besar dan data kecil disebabkan oleh jumlah data yang berbeda sehingga rataan centroid pada gerombol yang terbentuk saat proses algoritma TwoStep Cluster berbeda. Perbandingan penerapan metode TwoStep Cluster pada data berukuran besar dengan data berukuran kecil, menghasilkan persentase kesesuaian cukup baik yaitu sebesar 66,32%.