Analisis Fitur untuk Identifikasi Single Nucleotide Polymorphism Studi Kasus pada DNA Glycine max [L.] Merr
View/Open
Date
2019Author
Oktaviani, Shelvinta
Hasibuan, Lailan Sahrina
Metadata
Show full item recordAbstract
Single Nucleotide Polymorphism (SNP) merupakan marka DNA yang menunjukkan adanya variasi satu buah nukleotida pada suatu populasi spesies yang sama namun varietas berbeda. Identifikasi SNP atau SNP Calling merupakan tahapan penting untuk analisis keterkaitan SNP dan fenotipe. Tujuan penelitian ini adalah mengidentifikasi SNP menggunakan Boostrap Agregating (Bagging) CART dan Support Vector Machine. Bagging CART merupakan teknik klasifikasi dengan kompleksitas yang sederhana O(n log n) namun mampu memberikan alasan atas keputusan pengklasifikasian data. Sementara itu, SVM merupakan metode klasifikasi yang handal namun memiliki kompleksitas yang tinggi O(n3). Penelitian ini bertujuan untuk membandingkan kemampuan Bagging CART dan SVM dalam melakukan SNP Calling. Data yang digunakan adalah whole-genome kedelai budidaya (Glycine max [L.] Merr.) yang disekuen dengan teknologi Next-Generation Sequecing (NGS) Illumina. Data tersebut dibagi ke dalam 3 set data yang dibedakan berdasarkan kelompok fitur yang digunakan. Berdasarkan metode Bagging CART, dataset 2 memperoleh nilai f-measure yang tertinggi yaitu 0.63. Nilai ini lebih tinggi dibandingkan model yang dibangun menggunakan dataset 1 dan 3 yaitu 0.62. Adapun berdasarkan metode SVM , data yang memperoleh nilai f-measure tertinggi adalah dataset 1 yaitu sebesar 0.59. Nilai ini lebih tinggi dibandingkan model yang dibangun menggunakan dataset 2 dan 3 yaitu 0.56. Berdasarkan hasil yang diperoleh, metode Bagging CART lebih baik dibandingkan metode SVM untuk identifikasi SNP.
Collections
- UT - Computer Science [2336]