View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - School of Data Science, Mathematic and Informatics
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - School of Data Science, Mathematic and Informatics
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Evaluasi Kinerja Algoritma Biclustering Model Plaid dan SAMBA terhadap Jenis Buah-Buahan berdasarkan Provinsi di Indonesia

      Thumbnail
      View/Open
      Cover (597.5Kb)
      Fulltext (1.994Mb)
      Lampiran (358.3Kb)
      Date
      2025
      Author
      Alwani, Nadira Nisa
      Sumertajaya, I Made
      Wigena, Aji Hamim
      Metadata
      Show full item record
      Abstract
      Salah satu metode yang paling umum digunakan dalam pengolahan data adalah metode clustering, yaitu mengelompokkan data berdasarkan kemiripan pola antarobjek dalam satu dimensi yakni baris atau kolom. Metode clustering memiliki keterbatasan karena hanya dapat melakukan pengelompokan satu arah, yaitu mengelompokkan objek berdasarkan keseluruhan peubah secara simultan. Pendekatan ini tidak mampu untuk mengidentifikasi pola pada subset objek dan subset peubah secara bersamaan. Oleh karena itu, metode clustering kurang optimal dalam merepresentasikan struktur data yang bersifat kompleks, sehingga variasi pada dimensi tertentu tidak dapat terdeteksi maupun terkelompokkan dengan baik. Dalam mengatasi keterbatasan analisis clustering klasik saat menangani penggerombolan dua arah dapat menggunakan metode bicluster. Metode bicluster juga memungkinkan adanya pola tumpang tindih, dimana suatu objek dapat tergabung dalam lebih dari satu kelompok. Dalam pemilihan algoritma bicluster pada data tertentu belum memiliki pedoman khusus, sehingga pemilihan kriteria dapat didasarkan pada performa algoritma dalam menghasilkan bicluster. Algoritma Model Plaid dan SAMBA dipilih berdasarkan beberapa pertimbangan diantaranya kecepatan dalam menemukan bicluster, karakteristik unik bicluster yang terbentuk, dan kualitas bicluster yang dihasilkan. Algoritma bicluster ini akan diterapkan pada data produksi buah-buahan dari komoditas hortikultura di seluruh provinsi di Indonesia pada tahun 2022. Skenario simulasi menggunakan data background berukuran 34×24 berdistribusi normal baku, bertujuan untuk mengevaluasi kinerja antar model pada algoritma Model Plaid dalam mengidentifikasi bicluster dengan kriteria yang telah ditentukan. Data simulasi ini dibangkitkan berdasarkan faktor model bicluster (model konstan dan model koheren) dengan tingkat tumpang tindih sebesar 0%, 10%, dan 20%. Rata-rata terbobot kolom dan baris dihitung pada setiap tingkat tumpang tindih. Matriks yang telah dibangkitkan dilakukan pengacakan, kemudian dianalisis menggunakan algoritma Model Plaid. Berdasarkan hasil simulasi sebanyak 100 ulangan, menunjukkan bahwa algoritma Model Plaid mampu mengidentifikasi bicluster dengan cukup baik, meskipun nilai Indeks Liu dan Wang menunjukkan perubahan seiring meningkatnya tumpang tindih, akibat meningkatnya kompleksitas struktur data, model konstan dan model konstan baris menunjukkan performa terbaik untuk tipe bicluster konstan maupun koheren. Analisis bicluster pada data empiris menggunakan algoritma Model Plaid dan SAMBA menunjukkan bahwa keduanya memiliki tingkat koherensi bicluster yang cukup baik. Bicluster yang dihasilkan mencerminkan pola lokal dengan adanya struktur bicluster yang saling tumpang tindih. Dalam pemetaan produksi tanaman hortikultura buah-buahan di Indonesia, Model Plaid mengidentifikasi pola dengan kategori produksi menengah hingga tinggi, sementara algoritma SAMBA membentuk bicluster yang mencerminkan tingkat produksi dari rendah hingga tinggi. Kedua algoritma tersebut menghasilkan 5 bicluster, yang cenderung mengelompokkan potensi produksi buah-buahan kedalam kategori mayoritas tinggi. Algoritma SAMBA dengan parameter N_1=1,N_2=1,2,3,…,7,dan L=0,9. Model Plaid menghasilkan bicluster optimal dengan pendekatan model konstan baris menggunakan kombinasi parameter t_1=0,2 dan t_2=0,1. Secara keseluruhan, kedua algoritma berhasil memetakan seluruh kategori potensi produksi buah-buahan di Indonesia. Evaluasi terhadap kinerja algoritma bicluster pada data produksi buah di Indonesia menunjukkan bahwa algoritma SAMBA memberikan hasil yang lebih optimal dibandingkan Model Plaid berdasarkan beberapa indikator, seperti nilai ASR, indeks Liu dan Wang, profil bicluster, serta jumlah provinsi yang termasuk dalam setiap bicluster. Kualitas bicluster dinilai menggunakan nilai ASR semakin rendah nilainya, semakin baik kualitas bicluster yang dihasilkan. Algoritma SAMBA memperoleh nilai ASR sebesar 0,027, jauh lebih rendah dibandingkan Model Plaid yang memperoleh nilai 2,855. Selain itu, profil bicluster dari algoritma SAMBA memperlihatkan tingkat keseragaman yang lebih tinggi. Dalam hal cakupan keanggotaan baris, algoritma SAMBA mampu menghasilkan 25 provinsi atau sekitar 73,53%, sementara Model Plaid hanya menghasilkan 9 provinsi atau sekitar 26,47%.
      URI
      http://repository.ipb.ac.id/handle/123456789/171668
      Collections
      • MT - School of Data Science, Mathematic and Informatics [78]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository