Pemodelan Decision Tree untuk Prediksi Struktur Sekunder Protein
Abstract
Prediksi struktur sekunder protein adalah salah satu masalah yang sudah
lama dibahas dalam bidang bioinformatika. Berbagai metode telah diterapkan
namun masalah akurasi belum mencapai hasil yang maksimal. Penelitian ini
dilakukan untuk membangun suatu model prediksi struktur sekunder protein
dengan menggunakan decision tree dengan algoritme C4.5. Penentuan setiap kelas
dalam proses klasifikasi struktur sekunder protein dalam penelitian ini
berdasarkan pembelajaran terhadap pola masukan dalam proses pelatihan. Data
diperoleh dari Protein Data Bank (PDB) yang di-assign dengan format DSSP.
Pola masukan dibentuk dengan memanfaatkan sliding window dari sekuen asam
amino dengan ekstraksi fitur kimiafisik dan posisi atom. Model prediksi pengujian
cross validation tanpa fitur posisi atom menghasilkan nilai akurasi 90.49%,
sedangkan untuk pengujian dengan unknown data akurasinya menurun menjadi
51.29%. Kemudian dengan fitur posisi atom menghasilkan akurasi 90.17% untuk
metode cross validation dan 50.83% menggunakan unknown data. Hasil
penelitian tersebut memperlihatkan akurasi akan optimal jika menggunakan
known data dengan cross validation. Fitur posisi atom tidak dibutuhkan dalam
memprediksi struktur sekunder protein.
Collections
- UT - Computer Science [2482]
