Penerapan Analisis Gerombol Data Tidak Lengkap Dengan Algoritma Khusus Pada Data Kesejahteraan Rakyat Provinsi Aceh
View/ Open
Date
2016Author
Handayani, Rahmawati Eka
Erfiani
Syafitri, Utami Dyah
Metadata
Show full item recordAbstract
Analisis gerombol merupakan teknik peubah ganda yang mempunyai tujuan
utama untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristik
yang dimilikinya (Mattjik dan Sumertajaya 2011). Semakin mirip dua objek, maka
semakin besar kemungkinan dua objek tersebut untuk dikelompokkan dalam satu
gerombol. Analisis gerombol secara umum memerlukan data yang lengkap.
Permasalahan yang sering terjadi pada analisis gerombol adalah ditemukan
kumpulan objek atau peubah dengan data tidak lengkap.
Secara umum penanganan data tidak lengkap pada analisis gerombol dapat
dilakukan dengan tiga pendekatan. Pendekatan pertama adalah mengabaikan data
yang tidak lengkap (marginalisasi). Kelemahan dari pendekatan ini adalah
mengakibatkan kehilangan banyak informasi. Pendekatan kedua adalah menduga
data yang tidak lengkap. Pendugaan data dilakukan dengan metode imputasi, yaitu
menduga data tidak lengkap menggunakan angka nol, nilai median, nilai rata-rata,
dan lainnya. Pendugaan dengan metode imputasi lebih sering digunakan dengan
alasan lebih mudah dan sederhana (Safitri 2015). Kelemahan metode imputasi
dikemukakan oleh Wagstaff dan Laidler (2005) yaitu hasil pendugaan dari metode
imputasi tidak efisien karena memberikan informasi yang tidak berarti. Pendekatan
ke tiga yaitu metode tanpa imputasi yang digunakan untuk mengatasi kelemahan
dari metode imputasi. Beberapa penelitian yang mengembangkan metode tanpa
imputasi antara lain. Wagstaff (2004) melakukan penelitian penggerombolan untuk
data tidak lengkap tanpa imputasi dengan pendekatan k-means soft constraints
(KSC). Matyja dan Simiński (2014) telah melakukan penelitian penggerombolan
untuk data tidak lengkap dengan membandingkan metode imputasi, marginalisasi
dan algoritma khusus penggerombolan. Beberapa algorima khusus
penggerombolan yang digunakan seperti partial distance strategy (PDS), optimum
completion strategy (OCS), serta nearest prototype strategy (NPS). PDS
merupakan algoritma khusus penggerombolan data tidak lengkap tanpa imputasi,
sedangkan metode OCS dan NPS merupakan algorima khusus penggerombolan
data tidak lengkap dengan mengambil teknik imputasi di dalam proses iterasinya.
Hasil perbandingan tersebut memperoleh kesimpulan bahwa metode algoritma
khusus lebih unggul dalam menggerombolkan data tidak lengkap dibanding metode
imputasi dan marginalisasi. Safitri (2015) telah mengkaji metode gerombol tanpa
imputasi dengan membandingkan metode KSC dan metode PDS. Pada penelitian
tersebut didapat kesimpulan bahwa metode PDS lebih unggul dibanding metode
KSC.
Pada penelitian ini, digunakan metode algoritma khusus yaitu metode OCS
dan NPS yang diterapkan untuk menggerombolkan data kesejahteraan rakyat
Provinsi Aceh tahun 2006. Selanjutnya metode tersebut dibandingkan dengan
metode PDS dari hasil penelitian Safitri (2015). Data yang digunakan dalam
penelitian ini adalah data sekunder yang merupakan data yang sama dengan
penelitian Safitri (2015). Peubah yang digunakan ditinjau dari berbagai sumber,
seperti Rencana Pembangunan Jangka Panjang (RPJP), Millenium Development
Goals (MDGs), dan indikator kesejahteraan yang dipublikasikan oleh BPS dan
BAPPENAS Provinsi Aceh tahun 2007 yang bekerjasama dengan instansi
pemerintah lainnya.
Tujuan dari penelitian ini adalah mengelompokkan dan mengevaluasi hasil
gerombol kabupaten/kota di Provinsi Aceh tahun 2006. Penggerombolan dilakukan
berdasarkan indikator kesejahteraan rakyat. Metode Penggerombolan yang
digunakan adalah metode OCS dan NPS. Evaluasi hasil penggerombolan dilakukan
dengan dua cara yaitu menggunakan RMSSTD dan Pseudo F. Pada penelitian ini
pseudo F tidak dapat digunakan untuk mengevaluasi hasil penggerombolan karena
setiap jumlah gerombol memiliki penciri yang berbeda-beda. Hasil gerombol
optimum dapat ditentukan berdasarkan hasil RMSSTD. Jumlah gerombol optimum
yang diperoleh dari metode OCS yaitu 5 gerombol dengan nilai RMSSTD terkecil
0,6459. Pada metode NPS, jumlah gerombol dengan nilai RMSSD terkecil
diperoleh sebanyak 6 gerombol dengan nilai RMSSTD yaitu 0,6057.
Penelitian Safitri (2015), menggunakan data yang sama untuk menangani data
tidak lengkap dengan menggunakan metode PDS. Hasil penelitian tersebut
diperoleh nilai RMSSTD terkecil yaitu pada jumlah gerombol 4 dengan nilai
RMSSTD sebesar 0,7493. Nilai RMSSTD pada metode OCS dan NPS dengan
jumlah gerombol 4, masing-masing memperoleh nilai sebesar 0,6989 untuk OCS
dan 0,6983 untuk NPS. Berdasarkan hasil tersebut, menunjukkan bahwa metode
OCS dan NPS memiliki nilai RMSSTD lebih kecil dari metode PDS. Secara
keseluruhan metode OCS dan NPS lebih baik dari metode PDS pada penelitian
Safitri (2015) dalam menangani data tidak lengkap.
.
