View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - Faculty of Mathematics and Natural Sciences
      • UT - Computer Science
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Undergraduate Theses
      • UT - Faculty of Mathematics and Natural Sciences
      • UT - Computer Science
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Analisis CART dan Bagging CART pada Big Data dalam Identifikasi Single Nucleotide Polymorphism (SNP).

      No Thumbnail [100%x80]
      View/Open
      Fulltext (9.951Mb)
      Date
      2017
      Author
      Hudachair, Nurul
      Hasibuan, Lailan Sahrina
      Metadata
      Show full item record
      Abstract
      Big data merupakan istilah untuk data dan informasi yang tumbuh secara signifikan dari ukuran jumlah, baik pada data yang terstruktur maupun yang tidak terstruktur. Bioinformatika merupakan disiplin ilmu yang mengalami pertumbuhan data secara eksponensial dalam bebearpa tahun belakangan ini, yaitu sejak ditemukannya teknologi Next-Generation Sequencing (NGS). Salah satu kajian yang menarik di bidang bioinformatika adalah identifikasi polimorfisme nukleotida atau dikenal Single Nucleotide Polymorphism (SNP). Penelitian ini mengembangkan model dan menganalisis fitur-fitur terbaik yang dapat digunakan dalam identifikasi SNP. Metode yang digunakan adalah classification and regression trees (CART) dan bootstrap aggregating (bagging) CART dengan skema 11, 21, 31, 41, 51, 61, 71, 81 dan 91 pohon klasifikasi. Data yang digunakan adalah data whole-genome dari kedelai budidaya (Glycine max [L.] Merr.) yang disekuen menggunakan teknologi NGS, Genome Analyzer II Illumina. Pelatihan model menggunakan kandidat SNP pada kromosom 11, sementara pengujian menggunakan kandidat SNP pada kromosom 16. Hasil penelitian menunjukkan bahwa bagging CART dengan skema 51 pohon mampu membangun model klasifikasi SNP yang paling baik dibandingkan CART dan skema-skema lainnya berdasarkan metrik Fmeasure yaitu 0.63. Berdasarkan frekuensi kemunculan yang paling tinggi dari masing-masing skema pada bagging CART, fitur yang paling berperan dalam identifikasi SNP adalah max qual minor, freq minor dan mismatch alt.
      URI
      http://repository.ipb.ac.id/handle/123456789/90768
      Collections
      • UT - Computer Science [2338]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      NoThumbnail