Evaluasi Kinerja Algoritma Biclustering dalam Mengidentifikasi Pola Kerentanan Kemiskinan di Indonesia

Afnan, Irsyifa Mayzela

Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/161327

Title:	Evaluasi Kinerja Algoritma Biclustering dalam Mengidentifikasi Pola Kerentanan Kemiskinan di Indonesia
Other Titles:	Performance Evaluation of Biclustering Algorithms in Identifying Poverty Vulnerability Patterns in Indonesia
Authors:	Wijayanto, Hari Wigena, Aji Hamim Afnan, Irsyifa Mayzela
Issue Date:	2025
Publisher:	IPB University
Abstract:	Biclustering merupakan metode penggerombolan dua arah yang bekerja dengan menghubungkan gerombol objek dan gerombol peubah secara simultan pada data matriks. Metode ini bertujuan untuk menemukan pola lokal dari suatu hasil penggerombolan dua arah. Pada awal kemunculannya, biclustering banyak diterapkan dalam bidang bioinformatika. Saat ini, sudah mulai diterapkan dalam berbagai bidang ilmu lainnya. Dalam penerapannya, terdapat berbagai algoritma biclustering yang dapat digunakan, namun belum ada pedoman khusus yang dapat dijadikan acuan dalam pemilihan algoritma yang tepat. Penelitian ini bertujuan untuk mengevaluasi kinerja algoritma biclustering Cheng dan Chruch (CC) dan BCBimax dalam mengidentifikasi pola kerentanan kemiskinan di Indonesia dan mengevaluasi kinerja algoritma pada data berdasarkan faktor tumpang tindih. Pemilihan kedua algoritma tersebut didasarkan oleh beberapa pertimbangan diantaranya, kemudahan algoritma dalam mempartisi matriks menjadi sejumlah submatriks dan kecepatan algoritma dalam menemukan bicluster. Kajian simulasi yang dilakukan bertujuan untuk mengevaluasi kinerja algoritma CC dan BCBimax dalam mengidentifikasi bicluster aktual dengan tingkat tumpang tindih sebesar 0%, 10%, 20%, dan 30%. Simulasi dilakukan dengan terlebih dahulu membangkitkan data background berukuran 50 × 50 berdistribusi normal baku. Selanjutnya, sejumlah dua bicluster disisipkan dengan distribusi normal dengan rata-rata sebesar 10 dan 15, ragam sebesar 0,1, dengan model konstan. Kolom dan baris yang terdapat tumpang tindih akan diisi dengan rata-rata terbobot. Selanjutnya, dilakukan pengacakan pada matriks dan dianalisis menggunakan algoritma CC dan BCBimax. Evaluasi kinerja algoritma CC dan BCBimax menggunakan nilai indeks Liu dan Wang. Hasil kajian simulasi menunjukkan bahwa algoritma BCBimax memiliki kestabilan yang cenderung lebih baik dibandingkan CC. Kedua algoritma mampu mengidentifikasi bicluster dengan sangat optimal ketika tidak ada tumpang tindih, ditunjukkan oleh nilai indeks Liu dan Wang yang mencapai 1. Namun, saat tumpang tindih meningkat, performa keduanya menurun, dengan penurunan yang lebih signifikan yaitu pada algoritma CC. Secara keseluruhan, algoritma BCBimax lebih robust, dengan kemampuan mempertahankan nilai indeks yang lebih tinggi dibandingkan CC. Hal ini menunjukkan algoritma BCBimax lebih baik dalam mengidentifikasi bicluster aktual dibandingkan CC. Pada data empiris, analisis bicluster diterapkan pada data kemiskinan di Indonesia. Algoritma CC dapat menemukan bicluster optimal pada threshold 0,01 yang menghasilkan 7 bicluster, sementara algoritma BCBimax sebanyak 13 bicluster. Kedua algoritma menghasilkan bicluster yang tidak tumpang tindih atau bersifat exclusive rows biclusters. Pemetaan kerentanan kemiskinan di Indonesia menggunakan algoritma CC menghasilkan pola dengan tingkat kerentanan kemiskinan yang bervariasi, mulai dari rendah hingga tinggi. Sementara, algoritma BCBimax menghasilkan bicluster dengan tingkat kerentanan mayoritas tinggi. Hasil evaluasi kinerja algoritma biclustering pada data kemiskinan di Indonesia menunjukkan bahwa algoritma CC memiliki kinerja yang lebih baik dibandingkan algoritma BCBimax berdasarkan beberapa pertimbangan, yaitu nilai ASR, indeks Liu dan Wang, profil bicluster, dan cakupan keanggotaan baris (provinsi). Koherensi bicluster diukur menggunakan ASR, semakin rendah nilai ASR mengindikasikan semakin baik kualitas bicluster yang terbentuk. Algoritma CC menghasilkan nilai ASR sebesar 0,00649, sementara BCBimax memiliki nilai ASR sebesar 0,100512. Selain itu, profil bicluster yang dihasilkan oleh algoritma CC menunjukkan keseragaman yang lebih tinggi dibandingkan BCBimax. Dari sisi cakupan keanggotaan baris, algoritma CC berhasil memetakan sebanyak 34 provinsi di Indonesia (100%), sementara BCBimax hanya menggerombolkan sebanyak 27 provinsi (79,41%).
URI:	http://repository.ipb.ac.id/handle/123456789/161327
Appears in Collections:	MT - School of Data Science, Mathematic and Informatics

Files in This Item:

File	Description	Size	Format
cover_G1501222062_423d9f1d1d51416e958b833b3c33d08b.pdf	Cover	3.11 MB	Adobe PDF	View/Open
fulltext_G1501222062_9f681ad9cefd450aa36f6aa1a5e2814b.pdf Restricted Access	Fulltext	5 MB	Adobe PDF	View/Open
lampiran_G1501222062_573c2792ef324b2f8d8118cc33ae4dc3.pdf Restricted Access	Lampiran	2.47 MB	Adobe PDF	View/Open

Show full item record Recommend this item

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets