Pengelompokan Fragmen Metagenom Menggunakan Self-Organizing Map (SOM)
View/ Open
Date
2015Author
Achmad, Yunita Fauzia
Kusuma, Wisnu Ananta
Sukoco, Heru
Metadata
Show full item recordAbstract
Metgenomics adalah cabang dari bioinformatika yang mempelajari tentang
metagenom, sekelompok mikroorganisme yang diambil langsung dari lingkungan
tanpa proses kultur. Fragmen-fragmen yang diperoleh dari metagenom
mengandung berbagai organisme dan melakukan proses perakitan secara langsung
dapat menghasilkan chimeris contigs. Dengan demikian, metode untuk
mengurangi kesalahan dalam proses perakitan diperlukan binning. Binning adalah
metode pengelompokan fragmen berdasarkan taksonomi. Dalam penelitian ini,
binning yang digunakan berdasarkan pendekatan komposisi. Dalam pendekatan
ini menggunakan SOM (self-organizing map). SOM adalah metode jaringan saraf
tiruan yang telah berhasil dipetakan dalam dimensi yang lebih tinggi. SOM
memiliki dua metode pelatihan yaitu sequential training dan batch training.
Tujuan dari penelitian ini adalah untuk membandingkan dua metode pelatihan
SOM dalam pengelompokan fragmen metagenom.
Penelitian ini juga menggunakan k-mers sebagai metode ekstrasi fitur. Kmer
menggunakan jumlah kombinasi K (kombinasi pasangan basa (ATCG)). K
yang digunakan adalah K = 4 berarti membentuk 44 = 256 kombinasi pasangan
basa dan K = 5 berarti membentuk 45 = 1024 kombinasi pasangan basa. Penelitian
ini juga menggunakan proses normalisasi dengan tujuan untuk menghilangkan
nila-nilai yang rangkap hasil ekstrasi fitur. Metode normalisasi yang digunakan
adalah normalisasi min-max.
Penelitian ini membandingkan kedua metode pelatihan yaitu sequential
training dan batch training untuk menemukan teknik pengelompokan terbaik.
Hasil penelitian menunjukkan bahwa batch training dapat mencapai 3.64% dari
map size [15 15]. Nilai kesalahan ini lebih kecil dari sequential training yang
mendapatkan nilai kesalahan 7.06% dari map size [10 10].
Hasil ANOVA dalam penelitian in pada dua metode pelatihan SOM.
Sequential training kombinasi pentanukleotida dan tetranukleotida perhitungan
quantization error dan persentase galat memiliki hasil yang signifikan untuk
pengelompokan fragmen metagenom. Perhitungan topographic error
menghasilkan nilai yang tidak signifikan terhadap pengelompokan fragmen
metagenom. Pehitungan ANOVA yang dilakukan dalam batch training, bahwa
perhitungan quantization error, topographic error dan persentase galat dengan
kombinasi tetranukleotida dan pentanukleotida memiliki nilai yang signifikan
terhadap pengelompokan fragmen metagenom