Identifikasi Single Nucleotide Polymorphism (SNP) pada Genom Kedelai Menggunakan Algoritme C5.0
View/Open
Date
2018Author
Kamelina, Sita Nabila
Hasibuan, Lailan Sahrina
Metadata
Show full item recordAbstract
Teknologi sequencing DNA mampu melakukan sequencing secara mudah dan cepat, sehingga dapat menghasilkan data sequencing dalam ukuran yang sangat besar. Identifikasi Single Nucleotide Polymorphism (SNP) pada data sequencing DNA merupakan masalah yang kompleks karena ukuran data yang digunakan sangat besar dan banyaknya error pada tahap sequecing itu sendiri. Salah satu dampak error pada proses sequencing DNA adalah banyaknya polimorfisme palsu. Tujuan penelitian ini yaitu untuk mengidentifikasi SNP menggunakan algoritme C5.0 dan menganalisis fitur-fitur yang terbaik dalam proses identifikasi SNP. Data yang digunakan adalah data whole-genome dari kedelai budidaya (Glycine max [L.] Merr.) yang disekuens dengan teknologi Next-Generation Sequecing (NGS). Tahap pemodelan dan pengujian menggunakan data latih Gm11 dan data uji Gm16. Algoritme C5.0 mampu mengklasifikasikan kelas true dengan sensitivity sebesar 0.58 dan precision sebesar 0.67 yang berarti banyak terdapat false positive, dan kemampuan model klasifikasi SNP dengan benar dengan f-measure sebesar 0.62.
Collections
- UT - Computer Science [2335]