Analisis pengelompokan objek dengan metode single linkage clustering dan Diskriminan Linear untuk kasus dua kelompok
Abstract
Banyak keragaman yang dapat dijumpai pada kehidupan ini sehingga pengelompokan suatu objek yang relatif homogen selalu menjadi permasalahan yang menarik. Analisis cluster merupakan teknik multivariat yang tujuan utamanya mengelompokkan objek-objek berdasarkan kesamaan karakteristik di antara objek-objek tersebut. Ciri pengelompokan yang baik, pertama terdapat kesamaan yang tinggi antar anggota dalam satu kelompok. Kedua, antar kelompok yang satu dengan kelompok lainnya memiliki perbedaan yang tinggi. Terdapat beberapa metode dalam analisis cluster, salah satu diantaranya adalah metode hierarki yang akan mengelompokkan objek-objek secara bertingkat. Metode agglomeratif merupakan metode hierarki yang sering dipakai untuk suatu data metrik. Metode ini secara algoritma akan mengelompokkan objek-objek berdasarkan tingkat kesamaan antar objek-objek dari yang terdekat sampai akhirnya semua objek berada dalam sebuah kelompok. Jarak antara suatu kelompok terhadap kelompok lainnya dihitung sebagai jarak minimum antara anggota kelompok pertama dengan anggota kelompok lainnya, metode pengukuran ini disebut sebagai single linkage clustering merupakan metode yang paling sederhana. Kevalidan hasil pengelompokan dengan metode yang digunakan perlu agar tidak terjadi kesalahan (misklasifikasi) yang cukup besar terutama pada saat menentukan strategi dari tujuan dilakukannya analisis cluster. Analisis diskriminan merupakan metode yang dapat digunakan untuk menguji kevalidan hasil dari metode yang digunakan pada analisis cluster dan juga merupakan analisis lanjutan untuk menentukan fungsi setiap kelompok yang terbentuk (fungsi diskriminan). Dari fungsi diskriminan dapat dengan mudah menentukan kelompok untuk suatu objek baru. Fungsi ini dapat diperoleh dari persamaan yang akan meminimumkan nilai expected cost of misclassification (ECM). Pengelompokan tujuh belas kabupaten/kota di Jawa Barat berdasarkan tiga indikator sosial ekonomi pada tahun 2002, yaitu upah minimum kabupaten/kota (UMK), persentase tingkat pengangguran, dan laju pertumbuhan ekonomi ke dalam dua kelompok menghasilkan fungsi diskriminan y = 6,0694x1 + 2,0993x2 + 0,5153x3 . Fungsi diskriminan yang diperoleh mempunyai ketepatan mengklasifikasikan kasus sebesar 94,12%. Maka, fungsi ini dapat digunakan untuk mengelompokkan sebuah kabupaten/kota berdasarkan ketiga indikator tersebut ke dalam kelompok dengan tingkat sosial ekonomi menengah ke bawah atau menengah ke atas.
Collections
- UT - Mathematics [1432]