Show simple item record

dc.contributor.advisorKusuma, Wisnu Ananta
dc.contributor.advisorBuono., Agus
dc.contributor.authorPekuwali, Arini Aha
dc.date.accessioned2016-02-25T04:09:19Z
dc.date.available2016-02-25T04:09:19Z
dc.date.issued2015
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/78697
dc.description.abstractMetagenomika adalah studi yang mempelajari keseluruhan informasi genetik tentang organisme-organisme dari sampel yang diambil langsung dari lingkungan. Lingkungan yang dimaksud seperti tanah, air, isi perut manusia, bangunan, limbah dan lain-lain yang merupakan tempat mikroba berkembang biak. Tahapan dalam metagenomika diawali dengan deoxyribonucleic acid (DNA) sequencing terhadap metagenome sampel. Karena diambil langsung dari lingkungan, fragmen yang dihasilkan mengandung berbagai mikroorganisme. Kondisi seperti ini memungkin terjadinya kesalahan perakitan terhadap fragmen metagenome, yaitu disambungkannya fragmen antara spesies yang satu dengan fragmen dari spesies yang lain. Permasalahan ini dapat diselesaikan menggunakan metode binning. Ada 2 pendekatan binning, yaitu homologi dan komposisi. Penelitian ini berfokus pada pendekatan komposisi. Binning berbasis komposisi mengelompokan fragmen-fragmen dari berbagai organisme berdasarkan tingkat taksonominya menggunakan teknik-teknik dalam machine learning. Ada 2 komponen penting dalam machine learning, yaitu ekstraksi fitur dan pengklasifikasian atau pengklusteran. Teknik machine learning yang digunakan dalam penelitian ini adalah spaced k-mers frekuensi sebagai metode pengekstraksi fitur dan Naïve Bayesian Classifier (NBC). Penggunaan metode spaced k-mers frekuensi menghasilkan banyak model posisi match (1) dan don’t care (0). Oleh karena itu, Algoritme Genetika digunakan untuk mengoptimasi model posisi yang menghasilkan akurasi pengklasifikasian tertinggi. Penelitian ini bertujuan untuk mengetahui model posisi yang menghasilkan akurasi pengklasifikasian tertinggi. Tujuan kedua penelitian ini adalah mengetahui pengaruh penggunaan don’t care pada pengekstraksi fitur k-mers frekuensi. Kromosom 111111110001 yang berarti [111 1111 10001] dengan nilai fitness 85,42 terpilih menjadi kromosom terbaik. Don’t care juga berperan dalam mereduksi jumlah fitur sehingga mempercepat waktu eksekusi 6 kali lebih cepat dibandingkan dengan k-mers frekuensi.id
dc.language.isoidid
dc.publisherBogor Agricultural University (IPB)id
dc.publisherBogor Agricultural University (IPB)id
dc.subject.ddcComputer scienceid
dc.subject.ddcAlgorithnsid
dc.titleOptimasi Pengekstraksi Fitur Spaced K-Mers Frekuensi Menggunakan Algoritme Genetika Pada Pengklasifikasian Fragmen Metagenomeid
dc.typeThesisid
dc.subject.keyworddon’t careid
dc.subject.keywordalgoritme genetikaid
dc.subject.keywordk-mersid
dc.subject.keywordmetagenomeid
dc.subject.keywordnaïve bayesian classifierid


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record