Show simple item record

dc.contributor.advisorWijayanto, Hari
dc.contributor.advisorWigena, Aji Hamim
dc.contributor.authorHidayati, Nurul
dc.date.accessioned2024-08-09T09:14:54Z
dc.date.available2024-08-09T09:14:54Z
dc.date.issued2024
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/156906
dc.description.abstractAnalisis gerombol (cluster analysis) merupakan salah satu metode analisis yang dapat digunakan untuk memperoleh informasi dari data dengan banyak peubah, baik untuk data dalam jumlah kecil maupun data dalam jumlah besar. Salah satu permasalahan yang sering muncul pada data adalah adanya pencilan atau pengamatan yang nilainya menyimpang atau berbeda jauh dari pengamatan lainnya. Pencilan dapat menyebabkan analisis statistik yang digunakan, dalam hal ini adalah analisis gerombol memberikan hasil yang bias karena struktur dari gerombol yang terbentuk bisa menjadi tidak sesuai dengan keadaan sebenarnya. Hal ini menyebabkan gerombol yang dihasilkan menjadi tidak representatif. Pemilihan metode yang tepat tentunya menjadi hal yang harus dipertimbangkan. K-Means merupakan algoritma penggerombolan dasar yang populer dan sudah banyak digunakan dalam berbagai bidang. Namun, K-Means sebagai algoritma penggerombolan yang menggunakan mean sebagai pusat gerombolnya menjadi sensitif terhadap pencilan, sehingga menyebabkan gerombol yang dihasilkan menjadi tidak representatif. Hal ini menyebabkan diperlukannya algoritma penggerombolan lain yang lebih robust terhadap pencilan. ICLARANS, yang merupakan pengembangan dari algoritma CLARANS, merupakan salah satu algoritma k-medoids dimana algoritma ini robust terhadap data yang mengandung pencilan. Hal ini dikarenakan algortima tersebut menggunakan medoid sebagai pusat gerombol. Selain itu, terdapat algoritma penggerombolan berbasis desnsity yang juga robust terhadap pencilan, salah satunya adalah 3WDBSCAN. 3W-DBSCAN (Three-way Clustering Method based on an Improved DBSCAN) yang merupakan pengembangan dari algortima DBSCAN merupakan algortima penggerombolan yang berbasis kepadatan, dimana daerah dengan kepadatan tinggi dianggap sebagai satu gerombol dan daerah dengan kepadatan rendah atau tidak tergabung dalam gerombol tertentu dianggap sebagai noise/pencilan. Dalam prosesnya, noise/pencilan yang dihasilkan akan dipertimbangkan untuk masuk ke dalam gerombol tertentu berdasarkan aturan tertentu. Tujuan dari penelitian ini adalah untuk mengkaji dan mengevaluasi algoritma k-means, ICLARANS, dan 3WDBSCAN pada data simulasi yang dibangkitkan dengan kondisi tertentu untuk menemukan algoritma dengan performa terbaik. Lalu, algoritma tersebut juga akan diterapkan pada data indikator kinerja pembangunan ekonomi daerah dan melihat karakteristik dari hasil penggerombolan berdasarkan algoritma terbaik. Data simulasi dibangkitkan dengan mempertimbangkan kondisi jarak antar gerombol, yaitu jarak jauh yang akan memisahkan gerombol yang terbentuk (tidak overlap) dan jarak dekat yang akan membuat gerombol mejadi overlap. Persentase pencilan juga ditambahkan pada data, yaitu sebesar 0%, 5%, dan 10%. Data dibangkitkan dari 2 peubah dan 3 peubah untuk masing-masing 2 gerombol dan 3 gerombol. Analisis gerombol yang dilakukan pada data simulasi akan dilakukan perulangan sebanyak 100 kali dan akan dievaluasi dengan akurasi dan silhouette score. Dari hasil analisis data simulasi, diperoleh bahwa untuk data yang overlap, baik yang tidak mengandung pencilan atau yang mengandung pencilan, algoritma 3WDBSCAN memberikan performa yang lebih baik jika dibandingkan dengan K-Means dan ICLARANS. Hal ini dilihat dari nilai silhouette score yang dihasilkan yang lebih tinggi dibandingkan K-Means dan ICLARANS. Untuk data yang tidak overlap dan mengandung pencilan algoritma ICLARANS memberikan performa yang lebih baik dibandingkan dengan k-means untuk data yang dibangkitkan dari 3 peubah, baik 2 gerombol maupun 3 gerombol. Data empiris yang digunakan adalah data indikator kinerja pembangunan ekonomi daerah yang diperoleh dari website BPS kabupaten/kota dan provinsi di Indonesia. Hasil analsis algoritma K-Means, ICLARANS, dan 3WDBSCAN pada data ini menunjukkan bahwa algoritma 3WDBSCAN menghasilkan nilai silhouette index yang paling tinggi dibandingkan dua algoritma lainnya, yang mana hal ini menunjukkan bahwa algoritma 3WDBSCAN memberikan performa yang lebih baik dalam mengelompokkan data indikator kinerja pembangunan ekonomi daerah. Gerombol yang dihasilkan dari analisis ini adalah 9 gerombol, dengan anggota gerombol 1 sebanyak 111 kabupaten/kota, gerombol 2 sebanyak 72 kabupaten/kota, gerombol 3 sebanyak 71 kabupaten/kota, gerombol 4 sebanyak 58 kabupaten/kota, gerombol 5 sebanyak 20 kabupaten/kota, gerombol 6 sebanyak 68 kabupaten/kota, gerombol 7 sebanyak 44 kabupaten/kota, gerombol 8 sebanyak 30 kabupaten/kota, dan gerombol 3 sebanyak 35 kabupaten/kota
dc.description.sponsorship
dc.language.isoid
dc.publisherIPB Universityid
dc.titleAnalisis Gerombol dengan Algoritma K-Means, ICLARANS, dan 3W-DBSCAN pada Data yang Mengandung Pencilanid
dc.title.alternativeCluster Analysis with K-Means, ICLARANS, and 3W-DBSCAN Algorithms on Data Containing Outliers
dc.typeTesis
dc.subject.keywordanalisis gerombolid
dc.subject.keywordk-meansid
dc.subject.keywordpencilanid
dc.subject.keyword3wdbscanid
dc.subject.keywordiclaransid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record