Penerapan K-means pada Imbalanced Data untuk Klasifikasi Metagenom.
Abstract
Metagenom merupakan studi DNA total dari sumber lingkungan yang
diisolasi secara langsung. Metagenom didasari pada isolasi dan karakterisasi DNA
dari sampel-sampel lingkungan tanpa diperlukannya budidaya dari
mikroorganisme. Studi metagenom mengacu pada kandungan genomik dari
ekosistem mikroba lengkap. Dikarenakan pada sampel mikroba yang digunakan
terdapat bermacam-macam jenis organisme maka perlu dilakukan proses
klasifikasi. Pada tahap proses klasifikasi metagenom umumnya terjadi
permasalahan imbalanced data yang dapat mempengaruhi keakuratan hasil
klasifikasi. Penelitian ini difokuskan untuk mengatasi masalah klasifikasi pada
imbalance data pada metagenom dengan K-means sebagai metode clustering dan
mengaplikasikan KNN (k-nearest neighbors) sebagai algoritme untuk
klasifikasinya. Berdasarkan hasil penelitian ini dapat diketahui bahwa akurasi
rata-rata kelas minoritas setelah dilakukan penyeimbangan data mengalami
peningkatan sebesar 4,35% untuk k=1. Adapun akurasi rata-rata pada kelas
minoritas untuk k= 3 dan k=5 setelah dilakukan penyeimbangan justru mengalami
penurunan sebesar masing-masing sebesar 1,21% dan 6,77%.
Collections
- UT - Computer Science [2254]