Evaluasi Kinerja Algoritma Biclustering dalam Mengidentifikasi Pola Kerentanan Kemiskinan di Indonesia
Date
2025Author
Afnan, Irsyifa Mayzela
Wijayanto, Hari
Wigena, Aji Hamim
Metadata
Show full item recordAbstract
Biclustering merupakan metode penggerombolan dua arah yang bekerja
dengan menghubungkan gerombol objek dan gerombol peubah secara simultan
pada data matriks. Metode ini bertujuan untuk menemukan pola lokal dari suatu
hasil penggerombolan dua arah. Pada awal kemunculannya, biclustering banyak
diterapkan dalam bidang bioinformatika. Saat ini, sudah mulai diterapkan dalam
berbagai bidang ilmu lainnya. Dalam penerapannya, terdapat berbagai algoritma
biclustering yang dapat digunakan, namun belum ada pedoman khusus yang dapat
dijadikan acuan dalam pemilihan algoritma yang tepat. Penelitian ini bertujuan
untuk mengevaluasi kinerja algoritma biclustering Cheng dan Chruch (CC) dan
BCBimax dalam mengidentifikasi pola kerentanan kemiskinan di Indonesia dan
mengevaluasi kinerja algoritma pada data berdasarkan faktor tumpang tindih.
Pemilihan kedua algoritma tersebut didasarkan oleh beberapa pertimbangan
diantaranya, kemudahan algoritma dalam mempartisi matriks menjadi sejumlah
submatriks dan kecepatan algoritma dalam menemukan bicluster.
Kajian simulasi yang dilakukan bertujuan untuk mengevaluasi kinerja
algoritma CC dan BCBimax dalam mengidentifikasi bicluster aktual dengan tingkat
tumpang tindih sebesar 0%, 10%, 20%, dan 30%. Simulasi dilakukan dengan
terlebih dahulu membangkitkan data background berukuran 50 × 50 berdistribusi
normal baku. Selanjutnya, sejumlah dua bicluster disisipkan dengan distribusi
normal dengan rata-rata sebesar 10 dan 15, ragam sebesar 0,1, dengan model
konstan. Kolom dan baris yang terdapat tumpang tindih akan diisi dengan rata-rata
terbobot. Selanjutnya, dilakukan pengacakan pada matriks dan dianalisis
menggunakan algoritma CC dan BCBimax. Evaluasi kinerja algoritma CC dan
BCBimax menggunakan nilai indeks Liu dan Wang. Hasil kajian simulasi
menunjukkan bahwa algoritma BCBimax memiliki kestabilan yang cenderung
lebih baik dibandingkan CC. Kedua algoritma mampu mengidentifikasi bicluster
dengan sangat optimal ketika tidak ada tumpang tindih, ditunjukkan oleh nilai
indeks Liu dan Wang yang mencapai 1. Namun, saat tumpang tindih meningkat,
performa keduanya menurun, dengan penurunan yang lebih signifikan yaitu pada
algoritma CC. Secara keseluruhan, algoritma BCBimax lebih robust, dengan
kemampuan mempertahankan nilai indeks yang lebih tinggi dibandingkan CC. Hal
ini menunjukkan algoritma BCBimax lebih baik dalam mengidentifikasi bicluster
aktual dibandingkan CC.
Pada data empiris, analisis bicluster diterapkan pada data kemiskinan di
Indonesia. Algoritma CC dapat menemukan bicluster optimal pada threshold 0,01
yang menghasilkan 7 bicluster, sementara algoritma BCBimax sebanyak 13
bicluster. Kedua algoritma menghasilkan bicluster yang tidak tumpang tindih atau
bersifat exclusive rows biclusters. Pemetaan kerentanan kemiskinan di Indonesia
menggunakan algoritma CC menghasilkan pola dengan tingkat kerentanan
kemiskinan yang bervariasi, mulai dari rendah hingga tinggi. Sementara, algoritma
BCBimax menghasilkan bicluster dengan tingkat kerentanan mayoritas tinggi.
Hasil evaluasi kinerja algoritma biclustering pada data kemiskinan di
Indonesia menunjukkan bahwa algoritma CC memiliki kinerja yang lebih baik
dibandingkan algoritma BCBimax berdasarkan beberapa pertimbangan, yaitu nilai
ASR, indeks Liu dan Wang, profil bicluster, dan cakupan keanggotaan baris
(provinsi). Koherensi bicluster diukur menggunakan ASR, semakin rendah nilai
ASR mengindikasikan semakin baik kualitas bicluster yang terbentuk. Algoritma
CC menghasilkan nilai ASR sebesar 0,00649, sementara BCBimax memiliki nilai
ASR sebesar 0,100512. Selain itu, profil bicluster yang dihasilkan oleh algoritma
CC menunjukkan keseragaman yang lebih tinggi dibandingkan BCBimax. Dari sisi
cakupan keanggotaan baris, algoritma CC berhasil memetakan sebanyak 34
provinsi di Indonesia (100%), sementara BCBimax hanya menggerombolkan
sebanyak 27 provinsi (79,41%).