Penerapan Algoritma DBSCAN untuk Penggerombolan Kota/Kabupaten di Jawa Barat Berdasarkan Indikator Rawan Pangan
Abstract
Terdapat beberapa permasalahan umum ketika melakukan analisis gerombol,
diantaranya adalah adanya “curse of dimensionality” di ruang dimensi tinggi dan
adanya bentuk gerombol yang tidak beraturan (arbitrary) serta kehadiran outlier.
Permasalahan tersebut dapat diatasi dengan melakukan reduksi dimensi terlebih
dahulu dan menggunakan analisis gerombol yang berbasis kepadatan. Kerawanan
pangan merupakan salah satu permasalahan utama yang menjadi isu global bagi
sebagian besar negara. Di Indonesia terdapat FSVA (Food Security and
Vulnerability Atlas) yang merupakan peta tematik visualisasi geografis wilayah
rentan terhadap kerawanan pangan. Penentuan status rawan pangan suatu daerah
pada FSVA diukur dengan analisis yang relatif sederhana yaitu metode pembobotan
pada sembilan indikator kerawanan pangan kronis. Pada penelitian kali ini,
penggerombolan wilayah yang rentan terhadap kerawanan pangan untuk
kota/kabupaten di Jawa Barat dilakukan dengan metode machine learning dan
indikator yang digunakan lebih beragam (25 peubah) untuk menghasilkan gerombol
yang lebih baik. Penggerombolan dilakukan dengan metode DBSCAN (DensityBased Spatial Clustering of Applications with Noise) pada data yang telah direduksi
dimensi terlebih dahulu menggunakan metode t-SNE (t-Distributed Stochastic
Neighbor Embedding). Data yang digunakan dalam penelitian ini adalah data
Susenas (Survei Sosial Ekonomi Nasional) tahun 2020 untuk provinsi Jawa Barat.
Hasil penggerombolan terbaik ditentukan berdasarkan parameter optimal yang
dievaluasi menggunakan koefisien Silhouette dan indeks DBCV (Density Based
Clustering Validation). Parameter optimal yang menghasilkan koefisien Silhouette
dan indeks DBCV tertinggi diperoleh pada perplexity = 1, epsilon = 31, dan minPts
= 2. Penggerombolan terbaik menghasilkan lima gerombol dengan tidak ada outlier. There are several common problems when performing cluster analysis, including
the existence of a “curse of dimensionality” in high-dimensional space and the presence
of arbitrary cluster shapes, and also the presence of outliers. These problems can be solved
by reducing the dimensions first and using density-based cluster analysis. Food insecurity
is one of the main problems that become a global issue for most countries. In Indonesia,
there is an FSVA (Food Security and Vulnerability Atlas) which is a thematic map
visualizing geographical areas vulnerable to food insecurity. Determination of the food
insecurity status of an area on the FSVA is measured by relatively simple analysis, namely
the weighting method on nine indicators of chronic food insecurity. In this study,
clustering of areas that are vulnerable to food insecurity for cities/districts of West Java
is carried out using machine learning methods and the indicators used are more diverse
(25 variables) to produce better clusters. Clustering is performed using the DBSCAN
(Density-Based Spatial Clustering of Applications with Noise) method on data that has
been reduced in dimensions first using t-SNE (t-Distributed Stochastic Neighbor
Embedding). The data used in this study is the 2020 Susenas (Survei Sosial Ekonomi
Nasional) data for the province of West Java. The best clustering result is determined
based on the optimal parameters evaluated using the Silhouette coefficient and the DBCV
(Density-Based Clustering Validation) index. Optimal parameters that produce the
highest Silhouette coefficient and DBCV index are obtained at perplexity = 1, epsilon =
31, and minPts = 2. The best clustering results in five clusters with no outliers.