Kajian Perbandingan Metode K-Means dan Fuzzy C-Means untuk Menggerombolkan Kecamatan Di Provinsi Jawa Barat Berdasarkan Data Kemiskinan.
View/ Open
Date
2017Author
Khairunnisa
Notodiputro, Khairil Anwar
Sadik, Kusman
Metadata
Show full item recordAbstract
Analisis gerombol merupakan salah satu teknik yang sangat populer dalam
statistika. Tujuan dari analisis gerombol adalah untuk menggerombolkan n objek
ke dalam c gerombol, sehingga diperoleh kemiripan objek dalam gerombol yang
sama dibandingkan antar objek dari gerombol yang berbeda. Dalam analisis
gerombol terdapat dua metode penggerombolan, yaitu berhirarki dan metode tak
berhirarki. Salah satu dari metode tak berhirarki yang sering digunakan adalah kmeans.
K-means merupakan metode penggerombolan yang tegas, yaitu
mempunyai nilai keanggotaan 0 dan 1. Akan tetapi jika nilai keanggotaan suatu
objek adalah 0 sampai 1, maka penggerombolan menggunakan metode k-means
menjadi kurang tepat.
Fuzzy c-means adalah sebuah metode yang mengijinkan suatu objek dapat
menjadi anggota dari dua atau lebih gerombol. Fuzzy c-means merupakan
pengembangan dari metode k-means. Pada dasarnya metode fuzzy c-means
maupun k-means memiliki teknik yang berbeda dalam proses pembentukan
gerombol. Dalam beberapa penelitian yang telah dilakukan diantaranya Lu et all
(2013), Sivaranthri & Govardhan (2014) dan Cebeci & Yildiz (2015) tidak
ditemui suatu penjelasan tentang dalam keadaan bagaimana kedua metode
tersebut sebaiknya digunakan. Oleh sebab itu, perlu dilakukan kajian lebih lanjut
terhadap perbandingan metode k-means dan fuzzy c-means. Masalah yang dapat
dimunculkan dari ketiga penelitian sebelumnya adalah himpunan data yang
digunakan tidak memperhatikan adanya kemungkinan hubungan atau korelasi
diantara peubah-peubah yang digunakan. Padahal kenyataan di lapangan biasanya
meperlihatkan adanya hubungan antar peubah. Dengan demikian, peneliti tertarik
mengkaji masalah tersebut untuk melengkapi hasil penelitian sebelumnya. Kajian
ini dilakukan dengan data simulasi dan data riil (data kemiksinan). Tujuan
penelitian adalah membandingkan hasil penggerombolan metode k-means dan
fuzzy c-means, mengidentifikasi pola-pola data yang sesuai untuk penerapan pada
metode k-means dan fuzzy c-means serta menerapakan metode terbaik untuk
menggerombolkan kecamatan di Provinsi Jawa Barat.
Data simulasi merupakan data bangkitan yang terdiri atas k populasi
(gerombol) dengan ukuran tiap populasi berbeda dan jumlah populasi total N =
611. Beberapa aspek yang ditinjau pada kajian simulasi ini yaitu jarak vektor
rataan antar gerombol ( ), nilai ragam ( ), dan korelasi antar peubah ( ). Data
simulasi dibangkitkan berasal dari sebaran normal ganda ( ) yang terdiri
atas 8 peubah X yang saling berkorelasi kuat. Pembangkitan data simulasi terdiri
atas 2 dan 3 gerombol yang terbagi ke dalam tiga rancangan, yaitu memiliki jarak
antar pusat gerombol tidak terpisah (rancangan I), memiliki jarak antar pusat
gerombol yang terpisah dan tidak terpisah (rancangan II) dan memiliki jarak antar
pusat gerombol terpisah jauh (rancangan III).
Data riil yang digunakan pada penelitian ini berasal dari data Susenas tahun
2015 di Provinsi Jawa Barat yang diperoleh dari Badan Pusat Statistik (BPS).
Kabupaten/kota di Provinsi Jawa Barat terdiri atas 626 kecamatan dimana 611
kecamatan merupakan area yang disurvei. Pada penelitian ini penggerombolan
dilakukan berdasarkan 611 kecamatan. Peubah pada data Susenas yang digunakan
adalah yang terkait untuk mengidentifikasi kemiskinan rumah tangga secara
multidimensi. Banyak peubah Indeks Kemiskinan Multidimensi adalah 10 peubah
yang terbagi ke dalam 3 dimensi, yaitu kesehatan terdiri 2 peubah, pendidikan
terdiri 2 peubah dan standar hidup 6 peubah.
Kajian simulasi menunjukkan bahwa rata-rata persentase hasil ketepatan
gerombol menggunakan metode k-means maupun fuzzy c-means sangat
dipengaruhi oleh jarak antar pusat gerombol, nilai ragam dan korelasi antar
peubah. Kajian terapan pada data kemiskinan di Provinsi Jawa Barat
menunjukkan bahwa tingkat kemiskinan di Provinsi Jawa Barat berdasarkan hasil
penggerombolan dengan metode fuzzy c-means menunjukkan bahwa anggota dari
masing-masing gerombol sangat dipengaruhi oleh karakteristik tinggi rendahnya
Indeks Kemiskinan Multidimensi tiap kecamatan.