PENGGUNAAN lllDDEN MARKOV MODEL (HMM) UNTUK MENGIDENTIFIKASI RNAFAMILY
Abstract
Pada awalnya, untuk mengklasifikasikan sekuens baru dari Asam Ribonukelat (RNA) dilakukan pensejajaran dua sekuens. Namun hal ini mengalami kendala apabila terdapat fragmen dari sekuens tersebut yang tidak lengkap. Hidden Markov Model (HMM) merupakan model probabilistik yang banyak diaplikasikan untuk permasalahan deret waktu atau sekuens linear. Di sisi lain, non-coding RNA memiliki banyak family yang dapat diidentifikasi dengan melihat untaian sekuensnya. Penelitian pendekatan model HMM yang digunakan memiliki jumlah state sebanyak 2 hidden state dan 3 hidden state. Data yang digunakan pada penelitian ini adalah data sekuens non-coding RNA (ncRNA) dari Genome Research Institute yang telah terlabeli sebanyak 5066 yang terbagi menjadi 7 kelas. Dari data tersebut 50% digunakan sebagai data pelatihan dan sisanya digunakan sebagai pengujian. Hasil pengujian menunjukkan bahwa penggunaan 3 hidden state akan menghasilkan identifikasi yang secara umum lebih tinggi dibandingkan dengan 2 state. Rata-rata akurasi terbaik terc!apat pada identifikasi kelas ke-7 dengan 3 hidden state yaitu sebesar 77.D8%. Akan tetapi, terjadi kondisi yang kontradiksi pada identifikasi kelas pertama dengan penurunan rata-rata tingkat akurasi yang sangat signifikan menjadi 5.44 % dengan 3 hidden state.
Collections
- Proceedings [2790]