Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/137528
Title: Perbandingan Cluster Optimal pada AlgoritmaChengand Church Biclustering dan Algoritma K-Means untuk Mengetahui PolaDistribusi Ekspor Indonesia.
Authors: Syafitri, Utami Dyah
Baehera, Seta
Issue Date: 19-Jan-2024
Publisher: IPB University
Abstract: Clustering merupakan proses mengelompokan data ke dalam beberapa kelompok (cluster) sehingga data amatan dalam satu cluster memiliki kemiripan yang homogen dan data amatan antar cluster memiliki kemiripan yang heterogen (Tan 2006). Salah satu metode clustering yang umum dipakai sekarang ini adalah K-Means Clustering. Berbeda dengan analisis clustering, analisis biclustering merupakan pengelompokan untuk data dua dimensi. Biclustering memiliki kemampuan untuk menemukan himpunan bagian yang bermakna dari subjek dan peubah secara bersamaan. Salah satu metode analisis yang termasuk ke dalam biclustering yaitu algoritma Cheng dan Church (CC) atau disebut juga δ-biclustering (Cheng & Church, 2000). Tujuan algoritma δ-biclustering adalah untuk menemukan bicluster dengan nilai Mean Squared Residual (MSR) lebih kecil dari suatu nilai toleransi (δ) yang telah ditentukan (Kaban et al. 2019). Dalam kegiatan ekspor Indonesia selama kurun waktu tahun 2022, nilai pangsa ekspor Indonesia mencapai angka US$ 291,90 miliar. Selama kurun waktu tersebut juga, sebanyak 238 negara telah menjadi negara tujuan ekspor. Beberapa sektor komoditas yang menjadi komoditas utama ekspor adalah sektor pertanian, sektor industri pengolahan dan sektor pertambangan. Besarnya nilai ekspor, beragamnya komoditas serta banyaknya negara tujuan ekspor yang terlibat dalam kegiatan ekspor Indonesia, menjadi hal yang perlu dikaji lebih lanjut untuk dapat mengetahui pola distribusi barang ekspor Indonesia. Tujuan dilakukannya penelitian ini adalah untuk memperoleh cluster optimal dengan menggunakan sebuah pemodelan bicluster, yaitu algoritma Cheng dan Church (CC) atau biasa disebut juga δ-Biclustering dan membandingkannya dengan algoritma K-Means Clustering sebagai algoritma clustering klasik. Seluruh algoritma pengelompokan tersebut akan diterapkan pada data ekspor Indonesia pada kurun waktu 2013 hingga 2022. Pra-prosesing data tersebut dilakukan dengan menggunakan metode data scaling dan juga Principal Component Analysis (PCA). Proses evaluasi terhadap kualitas bicluster diukur dengan menggunakan rataan MSR per volume dan indeks Liu dan Wang (Liu dan Wang, 2007). Pada penentuan jumlah cluster pada algoritma K-Means menggunakan metode elbow dan metode koefisien silhouette. Berdasarkan kedua metode tersebut jumlah cluster optimal sebanyak 2 cluster dan 7 cluster. Berdasarkan jumlah cluster optimal yang dihasilkan dibuat 6 skenario penelitian. Nilai rataan MSR/volume dengan nilai 0,822 pada skenario 2, yaitu: penerapan K-Means 7 cluster dengan normalisasi data menggunakan data scaling merupakan yang terkecil dibandingkan dengan nilai rataan MSR/volume pada kombinasi yang lainnya. Dengan demikian skenario 2 merupakan skenario terbaik yang diperoleh ketika penerapan algoritma K-Means. Algoritma CC Biclustering menggunakan nilai mean square residual (MSR) sebagai nilai toleransi (δ) dalam membentuk sebuah bicluster. Nilai toleransi (δ) yang digunakan adalah 0,10; 0,25; 0,40 dan 0,55. Berdasarkan beberapa jenis pra-prosesing data dan tingkat nilai toleransi (δ) sehingga didapatkan 12 skenario penelitian. Nilai rataan MSR/Volume terkecil diperoleh pada algoritma CC Biclustering menggunakan matriks data dengan data scaling pada nilai toleransi (δ) 0,10 (skenario 1), dengan nilai 0,077. Dengan demikian skenario 1 merupakan skenario terbaik yang diperoleh ketika menggunakan algoritma CC Biclustering. Berdasarkan nilai rataan MSR/Volume yang terkecil dari seluruh skenario baik dari hasil penerapan algoritma CC Biclustering dan K-Means diperoleh kesimpulan bahwa skenario 1 dari penerapan algoritma CC Biclustering merupakan skenario paling optimal yang dapat diterapkan pada data ekspor Indonesia kurun waktu tahun 2013-2022.
URI: http://repository.ipb.ac.id/handle/123456789/137528
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
Thesis_SetaBaehera_Final-signed-signed.pdf
  Restricted Access
Fulltext2.45 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.