Kajian Penggerombolan KML3D dengan Pendekatan Transformasi Mahalanobis pada Data Panel yang Mengandung Pencilan
Date
2025Author
Kapiluka, Kristuisno Martsuyanto
Wijayanto, Hari
Fitrianto, Anwar
Metadata
Show full item recordAbstract
Analisis gerombol merupakan suatu metode statistika yang bertujuan untuk
mengelompokkan objek ke dalam kelompok yang homogen. Salah satu metode
analisis gerombol yang cukup populer adalah K-Means. K-Means umumnya
banyak digunakan pada data cross section, yaitu data yang diukur pada satu waktu
tertentu. Seiring berkembangnya metode dan kebutuhan analisis, K-Means didesain
secara khusus untuk diterapkan pada data longitudinal atau data panel dengan nama
K-Means Longitudinal (KML). KML dikembangkan lagi menjadi K-Means
Longitudinal 3D (KML3D) untuk menggerombolkan data panel multivariat. Pada
data panel multivariat, sering ditemukan pengamatan yang berbeda jauh dari data
pengamatan lainnya. Pengamatan ini disebut sebagai pencilan, yang dapat
berdampak negatif pada penelitian. Adanya pencilan, perlu ditangani dengan
metode yang tepat sehingga memberikan hasil gerombol yang representatif. Selain
itu, data panel secara alamiah memiliki korelasi antar waktu yang disebabkan oleh
pengukuran berulang sepanjang waktu pada peubahnya. Hal ini diatasi dengan
transformasi berbasis jarak Mahalanobis. Transformasi dengan jarak Mahalanobis
klasik sensitif terhadap pencilan, sehingga diusulkan transformasi robust shrinkage
yang lebih efektif dalam menangani masalah pencilan.
Penelitian ini melakukan kajian penggerombolan KML3D pada data panel
statistik sosial dan kesejahteraan yang diukur selama 8 tahun (2016 – 2023). Kajian
penelitian dilakukan dengan dua pendekatan yaitu tanpa penanganan korelasi antar
waktu, dan dengan penanganan korelasi antar waktu. Pendekatan tanpa penanganan
korelasi antar waktu, langsung melakukan penggerombolan KML3D, sedangkan
pendekatan dengan penanganan korelasi antar waktu dilakukan sebelum
menerapkan KML3D. Penanganan korelasi antar waktu dilakukan menggunakan
dua bentuk transformasi Mahalanobis yaitu transformasi klasik dan transformasi
robust yang tahan terhadap pencilan. Hasil transformasi kemudian digerombolkan
dengan dua jenis jarak yaitu Euclidean dan Manhattan. Jumlah gerombol optimal
ditentukan dari nilai indeks Calinski-Harabasz (CH), sedangkan evaluasi gerombol
optimal terbaik menggunakan nilai rasio simpangan baku gerombol (????/????). Nilai
indeks CH yang paling tinggi dan rasio simpangan baku gerombol (????/????) terkecil
merupakan metode terbaik.
Pada prosedur tanpa penanganan korelasi antar waktu, kedua jarak (Euclidean
maupun Manhattan) menghasilkan jumlah gerombol optimal yang sama yaitu ?? =
3. Hasil evaluasi dengan rasio simpangan baku gerombol (????/????) menunjukkan
bahwa jarak Manhattan dengan nilai 0,3140 sedikit lebih baik dari jarak Euclidean
yang nilainya 0,3146. Adapun pada prosedur dengan penanganan korelasi antar
waktu, dua jenis transformasi dibandingkan pada masing-masing jarak yang
digunakan. Pada transfomasi Mahalanobis klasik, kedua jarak menunjukkan jumlah
gerombol optimal pada ?? = 5. Sebaliknya pada transformasi Mahalanobis robust,
jarak Manhattan secara signifikan menunjukkan hasil yang lebih baik pada ?? = 4.
Berdasarkan hasil evaluasi dengan rasio simpangan baku gerombol (????/????),
transformasi Mahalanobis robust menghasilkan kinerja yang lebih optimal dari
transformasi Mahalanobis klasik. Secara keseluruhan, jarak Manhattan pada
transformasi Mahalanobis robust lebih efektif dengan nilai rasio yang paling kecil
yaitu 0,2534.
Hasil gerombol dari kombinasi metode terbaik menghasilkan jumlah
gerombol optimal terbaik (?? = 4). Gerombol 1 merupakan gerombol dengan
anggota terbanyak yaitu 18 anggota. Gerombol 2 dan 3 masing-masing 9 anggota
dan 6 anggota, sedangkan gerombol 4 hanya 1 anggota. Provinsi Papua adalah satu
satunya anggota gerombol 4 yang pada eksplorasi data di awal, terdeteksi sebagai
objek pencilan ekstrim. Hal ini menunjukkan bahwa kombinasi metode dari
transformasi Mahalanobis robust dengan jarak Manhattan mampu bekerja lebih
baik dalam memisahkan objek pencilan. Peubah penciri hasil gerombol
dikategorikan ke dalam tiga kategori yaitu kategori tinggi, sedang, dan rendah
berdasarkan nilai centroid-nya. Hasilnya menunjukkan karakteristik gerombol 3
lebih banyak dicirikan oleh peubah berkategori tinggi. Adapun gerombol 1 dan
gerombol 2 menunjukkan karakteristik yang cenderung mirip. Kedua gerombol ini
banyak didominasi oleh peubah penciri berkategori sedang. Terakhir, gerombol 4
sebagai gerombol pencilan banyak didominasi oleh peubah penciri berkategori
rendah. Dengan hasil ini, dapat disimpulkan bahwa provinsi-provinsi yang berada
di gerombol 3 memiliki indikator sosial dan kesejahteraan yang lebih baik dari
provinsi-provinsi lainnya. Gerombol 1 dan gerombol 2 menunjukkan indikator
sosial dan kesejahteraan yang cenderung mirip. Gerombol 4 sebagai gerombol
pencilan memiliki indikator sosial dan kesejahteraan yang jauh di bawah rata-rata
keseluruhan. Oleh karena itu, gerombol 4 perlu mendapat perhatian khusus dalam
peningkatan indikator sosial dan kesejahteraan secara nasional.
