Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/101658| Title: | Prediksi Protein-Protein Interaction Berbasis Sekuens Protein Menggunakan Fitur Autocorrelation dan Machine Learning |
| Authors: | Kusuma, Wisnu Ananta Wijaya, Sony Hartono Abdullah, Syahid |
| Issue Date: | 2019 |
| Publisher: | IPB University |
| Abstract: | Interaksi protein-protein atau protein-protein interaction (PPI) adalah hubungan molekuler antara suatu protein dengan protein lainnya yang terjadi di dalam sebuah sel atau suatu organisme hidup. PPI dapat digunakan untuk mendefinisikan fungsi sebuah protein dengan mengetahui posisi protein tersebut dalam sebuah jaringan kompleks interaksi protein. Banyak penelitian eksperimental yang dilakukan untuk mengidentifikasi PPI baru, namun jumlah PPI yang berhasil diidentifikasi relatif masih sangat sedikit. Menurut estimasi ada sekitar tiga ratus ribu PPI yang ada di dalam tubuh manusia. Oleh karena itu, beberapa penelitian lanjutan dilakukan untuk memprediksi PPI menggunakan informasi sekuens protein. Penelitian-penelitian tersebut dilakukan dengan mencoba berbagai kombinasi metode ekstraksi fitur dan metode klasifikasi. Salah satu metode ekstraksi fitur yang banyak digunakan adalah metode autocorrelation. Dalam mengekstraksi fitur dari sekuens protein, autocorrelation berguna untuk menghitung korelasi antar asam amino dalam setiap sekuens protein berdasarkan atribut physicochemical tertentu pada masing-masing asam amino tersebut. Selama ini metode autocorrelation yang digunakan untuk memprediksi PPI adalah Moran autocorrelation. Hasil prediksinya memiliki akurasi yang baik saat diterapkan pada beberapa metode klasifikasi. Selain Moran, terdapat dua metode autocorrelation lain yang memiliki formulasi yang berbeda, yaitu Geary dan Moreau-Broto. Dalam penelitian ini, dilakukan perbandingan kinerja ketiga metode autocorrelation tersebut dalam mengekstraksi fitur sekuens protein untuk memprediksi PPI. Hasil ekstraksi ketiganya lalu diterapkan pada tiga algoritme machine learning, yaitu k-Nearest Neighbor (KNN), Random Forest (RF), dan Support Vector Machine (SVM). Setelah dilakukan pengujian terhadap suatu gugus data, diketahui bahwa fitur yang dihasilkan oleh ketiga metode autocorrelation tersebut dapat menghasilkan prediksi dengan tingkat akurasi yang tinggi. Pada KNN, ratarata akurasi terbaik dari ketiga fitur tersebut mencapai 94%. Adapun pada RF dan SVM, rataan akurasi terbaiknya mencapai 97% pada hampir semua fitur. Dengan demikian, dapat disimpulkan bahwa fitur autocorrelation metode Moran, Geary, dan Moreau-Broto dapat digunakan untuk memprediksi kelas PPI dengan baik. |
| URI: | http://repository.ipb.ac.id/handle/123456789/101658 |
| Appears in Collections: | MT - Mathematics and Natural Science |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| 2019sab.pdf Restricted Access | 26.36 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.