Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/74823
Title: Identifikasi Single Nucleotide Polymorphism pada Genom Kedelai Menggunakan Metode Genetic Programming
Authors: Kusuma, Wisnu Ananta
Tasma, I Made
Istiadi, Muhammad Abrar
Issue Date: 2015
Abstract: Salah satu usaha peningkatan produksi kedelai (Glycine max) adalah melalui pemuliaan tanaman untuk memaksimalkan potensi genetik yang ada pada tanaman kedelai. Pemuliaan tanaman mutakhir berbasis marka molekuler atau marka DNA mampu membuat proses pemuliaan menjadi lebih efisien dibandingkan pemuliaan tanaman konvensional yang berbasis fenotipe. Salah satu marka molekuler mutakhir yang mulai banyak diteliti adalah Single Nucleotide Polymorphism (SNP) yang berupa perubahan atau variasi satu basa nukleotida pada sekuens DNA. Penelitian ini bertujuan mengidentifikasi SNP yang ada pada genom tanaman kedelai dengan menerapkan teknik Genetic Programming (GP) yang merupakan metode evolutionary untuk membangun classifier berbasis rule. Data yang digunakan pada penelitian ini merupakan sekuens DNA genom kedelai dari beberapa aksesi kedelai budidaya. Data tersebut dijajarkan (alignment) dengan sekuens DNA rujukan, kemudian dilakukan perhitungan sejumlah fitur statistik, antara lain kualitas basa dan kedalaman penjajaran. Hasil ekstraksi fitur tersebut diolah dengan GP sehingga dihasilkan rule klasifikasi yang optimal untuk membedakan true SNP (variasi basa yang benar ada dalam genom) dan false SNP (variasi basa yang timbul akibat kesalahan data sekuens). Hasil percobaan menunjukkan bahwa classifier berbasis rule yang dihasilkan oleh GP mampu mengklasifikasikan true dan false SNP dengan sensitivity rata-rata di atas 90% dan specificity rata-rata di atas 80%. Hal ini menandakan bahwa true SNP dapat teridentifikasi dengan baik. Namun demikian, nilai precision hanya sekitar 30% yang berarti banyak terdapat false positive. Hal ini berimplikasi bahwa banyak false SNP yang teridentifikasi sebagai true. Banyaknya false positive ini disebabkan oleh distribusi kelas yang tidak seimbang, yaitu perbandingan kelas true:false sekitar 1:9. Dari sisi rule yang dihasilkan, GP dapat membentuk rule yang sederhana dan dapat diinterpretasi dengan mudah. Salah satu pengetahuan hasil interpretasi yang dapat diambil dari rule yang dihasilkan adalah bahwa faktor atau fitur yang paling berperan dalam membedakan true dan false SNP adalah kualitas basa dari sekuens DNA. Jika kualitas basa tinggi, maka cenderung merupakan true SNP karena berarti kemungkinan kesalahan pada data sekuensnya kecil. Kinerja dari classifier berbasis rule yang dihasilkan oleh GP juga dibandingkan dengan algoritme klasifikasi C4.5 dan SVM dengan dataset yang sama. Hasil perbandingan menunjukkan bahwa classifier GP secara umum memiliki kinerja yang setara dengan C4.5 dan SVM, namun dengan keunggulan bahwa classifier GP berupa rule yang sederhana dan dapat diinterpretasi dibandingkan dengan decision tree hasil C4.5 yang cenderung kompleks dan model SVM yang bersifat black box.
URI: http://repository.ipb.ac.id/handle/123456789/74823
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
2015mai.pdf
  Restricted Access
Fulltext18.36 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.