Clustering Metagenom dengan Metode K-Medoids pada Model Pemrograman Map-Reduce
Abstract
Metagenom adalah ilmu yang mempelajari materi genetik yang diambil
langsung dari lingkungan tanpa budidaya. Kendala yang terjadi pada analisis
metagenom adalah bercampurnya fragmen DNA dan ukuran data yang sangat
besar. Penelitian ini bertujuan untuk mengimplementasikan metode k-medoids
menggunakan model pemograman map-reduce. Map-reduce adalah model
pemrograman yang berguna untuk mengatasi data berukuran besar yang dapat
diimplementasikan menggunakan Hadoop. Pada penelitian ini n-mers frequency
digunakan untuk melakukan ekstraksi ciri dan Euclidean distance untuk
mengukur jarak antar fragmen. Evaluasi clustering diukur menggunakan indeks
Davies-Bouldin dan purity. Hasil implementasi map-reduce dievaluasi dengan
speedup. Hasil evaluasi clustering menunjukan cluster dengan jumlah 3 memiliki
nilai Indeks Davies-Bouldin terbaik dengan nilai 2.002. Nilai purity dari hasil
clustering tersebut adalah 0.618 pada tingkat genus.
Collections
- UT - Computer Science [2322]