Show simple item record

dc.contributor.advisorArkeman, Yandra
dc.contributor.advisorKusuma, Ananta Wisnu
dc.contributor.authorChoiriyati, Nur
dc.date.accessioned2020-01-03T03:54:48Z
dc.date.available2020-01-03T03:54:48Z
dc.date.issued2019
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/100790
dc.description.abstractMetagenomika adalah studi yang mempelajari informasi genetik organisme-organisme yang sampelnya diambil langsung dari lingkungan, seperti dari tanah, air, ataupun dari perut manusia. Sampel metagenom yang diambil dari suatu lingkungan menghasilkan fragmen yang mengandung berbagai macam mikroorganisme sehingga perlu dilakukan pengelompokkan (binning) untuk mengetahui keragaman organisme dalam lingkungan mikroba tersebut. Proses binning dapat dilakukan dengan menghitung frekuensi kemunculan k-mers dari suatu sekuens metagenom. Kombinasi pola kemunculan k pasangan basa utama (Adenin, Cystosine, Guanin dan Thymine) adalah fitur yang digunakan sebagai masukan untuk pembelajaran dengan contoh atau biasa disebut sebagai klasifikasi (supervised learning). Ekstraksi fitur spaced k-mers dilakukan dengan membandingkan fragmen metagenom dengan substring berukuran k atau disebut k-mers namun membolehkan kondisi inexact matching. Kondisi inexact matching membolehkan adanya satu atau beberapa bagian yang tidak match dalam hal ini disebut sebagai don’t care position. Deep Learning muncul kembali sebagai paradigma baru dalam machine learning. Beberapa arsitektur Deep Learning memberikan solusi terbaik untuk banyak masalah dalam pengenalan pola seperti Convolutional Neural Network (CNN) untuk pengenalan citra, Recurrent Neural Network untuk pengenalan suara dan pemrosesan bahasa alami. Selain pengenalan citra, CNN juga dapat diterapkan sebagai classifier untuk data metagenom. Beberapa penelitian menunjukkan arsitektur CNN memberikan akurasi yang lebih baik dibandingkan arsitertur Deep Learning lainnya. Deep Neural Network (DNN) adalah simple neural network yang mempunyai banyak hidden layer dengan sekumpulan neuron dalam tiap hidden layer-nya. Tidak ada ukuran pasti untuk menentukan jumlah hidden layer dan jumlah hidden neuron dalam membentuk arsitektur neural network. Untuk itu diperlukan percobaan trial and error agar mendapatkan arsitektur yang paling optimal untuk digunakan sebagai classifier dalam machine learning. Selain itu, tidak seperti CNN, DNN tidak membangkitkan fitur dalam setiap hidden layer seperti CNN sehingga waktu komputasi DNN lebih cepat dibandingkan CNN. Penelitian ini bertujuan untuk membandingkan kinerja dua arsitektur Deep Learning yaitu DNN dan CNN untuk klasifikasi data metagenom. Kinerja classifier diukur dengan menghitung lama waktu pelatihan serta akurasi yang dihasilkan tiap model classifier dimana 1 adalah kondisi match dan 0 adalah don’t care position. Spaced k-mers dengan pola 111 1111 10001 digunakan sebagai ekstraksi fitur metagenom yang hasil fitur tersebut menjadi input untuk tiap model classifier. Hasil penelitian menunjukkan bahwa klasifikasi dengan menggunakan DNN memberikan akurasi sebesar 90.92% dan CNN classifier menghasilkan akurasi sebesar 88.89% pada taksonomi tingkat genus.id
dc.language.isoidid
dc.publisherIPB Universityid
dc.subject.ddcComputer scienceid
dc.subject.ddcSystem softwareid
dc.subject.ddc2018id
dc.subject.ddcBogor-Jawa Baratid
dc.titleKlasifikasi Fragmen Metagenom dengan Deep Learning dan Frekuensi Kemunculan Spaced K-Mers Sebagai Ekstraksi Fiturid
dc.typeThesisid
dc.subject.keywordconvolutional neural networkid
dc.subject.keywordDeep Learningid
dc.subject.keyworddeep neural networkid
dc.subject.keywordmetagenomid
dc.subject.keywordspaced k-mersid


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record