Evaluasi Kinerja Algoritma Biclustering dalam Mengidentifikasi Pola Kerentanan Kemiskinan di Indonesia

Afnan, Irsyifa Mayzela

View/Open

Cover (3.037Mb)

Fulltext (4.883Mb)

Lampiran (2.415Mb)

Date

2025

Author

Afnan, Irsyifa Mayzela

Wijayanto, Hari

Wigena, Aji Hamim

Metadata

Show full item record

Abstract

Biclustering merupakan metode penggerombolan dua arah yang bekerja dengan menghubungkan gerombol objek dan gerombol peubah secara simultan pada data matriks. Metode ini bertujuan untuk menemukan pola lokal dari suatu hasil penggerombolan dua arah. Pada awal kemunculannya, biclustering banyak diterapkan dalam bidang bioinformatika. Saat ini, sudah mulai diterapkan dalam berbagai bidang ilmu lainnya. Dalam penerapannya, terdapat berbagai algoritma biclustering yang dapat digunakan, namun belum ada pedoman khusus yang dapat dijadikan acuan dalam pemilihan algoritma yang tepat. Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma biclustering Cheng dan Chruch (CC) dan BCBimax dalam mengidentifikasi pola kerentanan kemiskinan di Indonesia dan mengevaluasi kinerja algoritma pada data berdasarkan faktor tumpang tindih. Pemilihan kedua algoritma tersebut didasarkan oleh beberapa pertimbangan diantaranya, kemudahan algoritma dalam mempartisi matriks menjadi sejumlah submatriks dan kecepatan algoritma dalam menemukan bicluster. Kajian simulasi yang dilakukan bertujuan untuk mengevaluasi kinerja algoritma CC dan BCBimax dalam mengidentifikasi bicluster aktual dengan tingkat tumpang tindih sebesar 0%, 10%, 20%, dan 30%. Simulasi dilakukan dengan terlebih dahulu membangkitkan data background berukuran 50 × 50 berdistribusi normal baku. Selanjutnya, sejumlah dua bicluster disisipkan dengan distribusi normal dengan rata-rata sebesar 10 dan 15, ragam sebesar 0,1, dengan model konstan. Kolom dan baris yang terdapat tumpang tindih akan diisi dengan rata-rata terbobot. Selanjutnya, dilakukan pengacakan pada matriks dan dianalisis menggunakan algoritma CC dan BCBimax. Evaluasi kinerja algoritma CC dan BCBimax menggunakan nilai indeks Liu dan Wang. Hasil kajian simulasi menunjukkan bahwa algoritma BCBimax memiliki kestabilan yang cenderung lebih baik dibandingkan CC. Kedua algoritma mampu mengidentifikasi bicluster dengan sangat optimal ketika tidak ada tumpang tindih, ditunjukkan oleh nilai indeks Liu dan Wang yang mencapai 1. Namun, saat tumpang tindih meningkat, performa keduanya menurun, dengan penurunan yang lebih signifikan yaitu pada algoritma CC. Secara keseluruhan, algoritma BCBimax lebih robust, dengan kemampuan mempertahankan nilai indeks yang lebih tinggi dibandingkan CC. Hal ini menunjukkan algoritma BCBimax lebih baik dalam mengidentifikasi bicluster aktual dibandingkan CC. Pada data empiris, analisis bicluster diterapkan pada data kemiskinan di Indonesia. Algoritma CC dapat menemukan bicluster optimal pada threshold 0,01 yang menghasilkan 7 bicluster, sementara algoritma BCBimax sebanyak 13 bicluster. Kedua algoritma menghasilkan bicluster yang tidak tumpang tindih atau bersifat exclusive rows biclusters. Pemetaan kerentanan kemiskinan di Indonesia menggunakan algoritma CC menghasilkan pola dengan tingkat kerentanan kemiskinan yang bervariasi, mulai dari rendah hingga tinggi. Sementara, algoritma BCBimax menghasilkan bicluster dengan tingkat kerentanan mayoritas tinggi. Hasil evaluasi kinerja algoritma biclustering pada data kemiskinan di Indonesia menunjukkan bahwa algoritma CC memiliki kinerja yang lebih baik dibandingkan algoritma BCBimax berdasarkan beberapa pertimbangan, yaitu nilai ASR, indeks Liu dan Wang, profil bicluster, dan cakupan keanggotaan baris (provinsi). Koherensi bicluster diukur menggunakan ASR, semakin rendah nilai ASR mengindikasikan semakin baik kualitas bicluster yang terbentuk. Algoritma CC menghasilkan nilai ASR sebesar 0,00649, sementara BCBimax memiliki nilai ASR sebesar 0,100512. Selain itu, profil bicluster yang dihasilkan oleh algoritma CC menunjukkan keseragaman yang lebih tinggi dibandingkan BCBimax. Dari sisi cakupan keanggotaan baris, algoritma CC berhasil memetakan sebanyak 34 provinsi di Indonesia (100%), sementara BCBimax hanya menggerombolkan sebanyak 27 provinsi (79,41%).

URI

http://repository.ipb.ac.id/handle/123456789/161327

Collections

MT - School of Data Science, Mathematic and Informatics [96]