View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Mathematics and Natural Science
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Mathematics and Natural Science
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Pengaruh teknik penyeimbangan data terhadap performa model identifikasi Single Nucleotide Polymorphism (SNP): Studi kasus genom Kedelai

      Thumbnail
      View/Open
      Fulltext (16.64Mb)
      Date
      2015
      Author
      Hasibuan, Lailan Sahrina
      Kusuma, Wisnu Ananta
      Suwarno, Willy Bayuardi
      Metadata
      Show full item record
      Abstract
      Single Nucleotide Polymorphism (SNP) merupakan tipe marka molekuler yang saat ini banyak diteliti. Marka ini menjadi populer karena mampu memberikan informasi yang baik akan keragaman DNA. Secara definisi, SNP dapat diartikan sebagai variasi satu basa nukleotida - A, C, T atau G - pada posisi yang sama antara DNA yang dijajarkan dari individu yang berbeda. Perkembangan penelitian mengenai SNP didukung oleh perkembangan teknologi sequencing DNA. Next-Generation Sequencing (NGS) adalah teknologi sequencing DNA terbaru. NGS mampu memberikan throughput yang tinggi dengan biaya yang relatif lebih murah dibandingkan teknologi sebelumnya. Namun, NGS memiliki kelemahan dalam hasil sequencing. Hasil sequencing diberikan dalam bentuk fragmen-fragmen dengan ukuran yang pendek. Hal ini berdampak pada analisis tahap lanjut seperti identifikasi SNP. Proses penjajaran fragmen DNA adalah tahapan yang harus dilakukan sebelum melakukan identifikasi SNP. Proses penjajaran menjadi lebih sulit dilakukan ketika diterapkan pada fragmen-fragmen dengan ukuran yang pendek. Tingkat kesalahan penjajaran bisa menjadi tinggi karena banyak fragmen yang dijajarkan tidak pada posisinya. Hal ini menyebabkan munculnya variasi basa karena error. Jumlah variasi basa karena error lebih banyak hingga beberapa kali lipat dibandingkan jumlah variasi basa karena SNP. Dengan kata lain, terjadi ketidakseimbangan data antara kelas SNP positf dan kelas SNP negatif. Machine learning yang dilatih menggunakan data latih tidak seimbang akan menghasilkan model dengan performa yang rendah karena model cenderung mengidentifikasi kandidat SNP sebagai anggota kelas mayor. dst ...
      URI
      http://repository.ipb.ac.id/handle/123456789/118432
      Collections
      • MT - Mathematics and Natural Science [4149]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository