Implementasi map-reduce pada k-means untuk clustering metagenom
Abstract
Metagenom merupakan DNA yang diperoleh langsung dari lingkungan. Kendala pada rekonstruksi DNA dari metagenom adalah bercampurnya fragmen DNA dari berbagai mikroorganisme serta besarnya ukuran data dari fragmen DNA yang didapat. Penelitian ini bertujuan melakukan pengelompokan untuk memisahkan fragmen DNA antar-mikroorganisme dengan metode k-means. Proses ekstraksi fitur dan clustering menerapkan model map-reduce untuk menangani besarnya ukuran data dari fragmen DNA. Penelitian ini menggunakan metode k-mers frequency untuk ekstraksi fitur dan Euclidean distance untuk ukuran jarak antarfragmen. Evaluasi hasil clustering diukur dengan indeks Davies-Bouldin dan purity. Hasil implementasi map-reduce dievaluasi dengan ukuran speedup. Evaluasi hasil clustering pada dataset yang digunakan menunjukkan pengelompokan dengan 3 cluster dan ekstraksi fitur 3-mer memiliki nilai indeks Davies-Bouldin terbaik yaitu 2.4413. Nilai purity dari hasil clustering tersebut ialah 0.6936 pada tingkat genus. Speedup rata-rata yang diperoleh dari implementasi map-reduce mendekati nilai 3.
Collections
- UT - Computer Science [2254]