Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/171668
Title: Evaluasi Kinerja Algoritma Biclustering Model Plaid dan SAMBA terhadap Jenis Buah-Buahan berdasarkan Provinsi di Indonesia
Other Titles: Performance Evaluation of the Plaid and SAMBA Biclustering Algorithms of Fruit Types by Province in Indonesia
Authors: Sumertajaya, I Made
Wigena, Aji Hamim
Alwani, Nadira Nisa
Issue Date: 2025
Publisher: IPB University
Abstract: Salah satu metode yang paling umum digunakan dalam pengolahan data adalah metode clustering, yaitu mengelompokkan data berdasarkan kemiripan pola antarobjek dalam satu dimensi yakni baris atau kolom. Metode clustering memiliki keterbatasan karena hanya dapat melakukan pengelompokan satu arah, yaitu mengelompokkan objek berdasarkan keseluruhan peubah secara simultan. Pendekatan ini tidak mampu untuk mengidentifikasi pola pada subset objek dan subset peubah secara bersamaan. Oleh karena itu, metode clustering kurang optimal dalam merepresentasikan struktur data yang bersifat kompleks, sehingga variasi pada dimensi tertentu tidak dapat terdeteksi maupun terkelompokkan dengan baik. Dalam mengatasi keterbatasan analisis clustering klasik saat menangani penggerombolan dua arah dapat menggunakan metode bicluster. Metode bicluster juga memungkinkan adanya pola tumpang tindih, dimana suatu objek dapat tergabung dalam lebih dari satu kelompok. Dalam pemilihan algoritma bicluster pada data tertentu belum memiliki pedoman khusus, sehingga pemilihan kriteria dapat didasarkan pada performa algoritma dalam menghasilkan bicluster. Algoritma Model Plaid dan SAMBA dipilih berdasarkan beberapa pertimbangan diantaranya kecepatan dalam menemukan bicluster, karakteristik unik bicluster yang terbentuk, dan kualitas bicluster yang dihasilkan. Algoritma bicluster ini akan diterapkan pada data produksi buah-buahan dari komoditas hortikultura di seluruh provinsi di Indonesia pada tahun 2022. Skenario simulasi menggunakan data background berukuran 34×24 berdistribusi normal baku, bertujuan untuk mengevaluasi kinerja antar model pada algoritma Model Plaid dalam mengidentifikasi bicluster dengan kriteria yang telah ditentukan. Data simulasi ini dibangkitkan berdasarkan faktor model bicluster (model konstan dan model koheren) dengan tingkat tumpang tindih sebesar 0%, 10%, dan 20%. Rata-rata terbobot kolom dan baris dihitung pada setiap tingkat tumpang tindih. Matriks yang telah dibangkitkan dilakukan pengacakan, kemudian dianalisis menggunakan algoritma Model Plaid. Berdasarkan hasil simulasi sebanyak 100 ulangan, menunjukkan bahwa algoritma Model Plaid mampu mengidentifikasi bicluster dengan cukup baik, meskipun nilai Indeks Liu dan Wang menunjukkan perubahan seiring meningkatnya tumpang tindih, akibat meningkatnya kompleksitas struktur data, model konstan dan model konstan baris menunjukkan performa terbaik untuk tipe bicluster konstan maupun koheren. Analisis bicluster pada data empiris menggunakan algoritma Model Plaid dan SAMBA menunjukkan bahwa keduanya memiliki tingkat koherensi bicluster yang cukup baik. Bicluster yang dihasilkan mencerminkan pola lokal dengan adanya struktur bicluster yang saling tumpang tindih. Dalam pemetaan produksi tanaman hortikultura buah-buahan di Indonesia, Model Plaid mengidentifikasi pola dengan kategori produksi menengah hingga tinggi, sementara algoritma SAMBA membentuk bicluster yang mencerminkan tingkat produksi dari rendah hingga tinggi. Kedua algoritma tersebut menghasilkan 5 bicluster, yang cenderung mengelompokkan potensi produksi buah-buahan kedalam kategori mayoritas tinggi. Algoritma SAMBA dengan parameter N_1=1,N_2=1,2,3,…,7,dan L=0,9. Model Plaid menghasilkan bicluster optimal dengan pendekatan model konstan baris menggunakan kombinasi parameter t_1=0,2 dan t_2=0,1. Secara keseluruhan, kedua algoritma berhasil memetakan seluruh kategori potensi produksi buah-buahan di Indonesia. Evaluasi terhadap kinerja algoritma bicluster pada data produksi buah di Indonesia menunjukkan bahwa algoritma SAMBA memberikan hasil yang lebih optimal dibandingkan Model Plaid berdasarkan beberapa indikator, seperti nilai ASR, indeks Liu dan Wang, profil bicluster, serta jumlah provinsi yang termasuk dalam setiap bicluster. Kualitas bicluster dinilai menggunakan nilai ASR semakin rendah nilainya, semakin baik kualitas bicluster yang dihasilkan. Algoritma SAMBA memperoleh nilai ASR sebesar 0,027, jauh lebih rendah dibandingkan Model Plaid yang memperoleh nilai 2,855. Selain itu, profil bicluster dari algoritma SAMBA memperlihatkan tingkat keseragaman yang lebih tinggi. Dalam hal cakupan keanggotaan baris, algoritma SAMBA mampu menghasilkan 25 provinsi atau sekitar 73,53%, sementara Model Plaid hanya menghasilkan 9 provinsi atau sekitar 26,47%.
URI: http://repository.ipb.ac.id/handle/123456789/171668
Appears in Collections:MT - School of Data Science, Mathematic and Informatics

Files in This Item:
File Description SizeFormat 
cover_G1501222048_7bd3c97b65cb45a6874a3632f9b78692.pdfCover597.58 kBAdobe PDFView/Open
fulltext_G1501222048_c4f40717a18446c0953c9a8bb96c92c4.pdf
  Restricted Access
Fulltext2.04 MBAdobe PDFView/Open
lampiran_G1501222048_777f7a4fe28b40b9b972448b907c8936.pdf
  Restricted Access
Lampiran358.36 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.