dc.description.abstract | Interaksi protein-protein atau protein-protein interaction (PPI) adalah
hubungan molekuler antara suatu protein dengan protein lainnya yang terjadi di
dalam sebuah sel atau suatu organisme hidup. PPI dapat digunakan untuk
mendefinisikan fungsi sebuah protein dengan mengetahui posisi protein tersebut
dalam sebuah jaringan kompleks interaksi protein. Banyak penelitian eksperimental
yang dilakukan untuk mengidentifikasi PPI baru, namun jumlah PPI yang berhasil
diidentifikasi relatif masih sangat sedikit. Menurut estimasi ada sekitar tiga ratus
ribu PPI yang ada di dalam tubuh manusia. Oleh karena itu, beberapa penelitian
lanjutan dilakukan untuk memprediksi PPI menggunakan informasi sekuens
protein. Penelitian-penelitian tersebut dilakukan dengan mencoba berbagai
kombinasi metode ekstraksi fitur dan metode klasifikasi.
Salah satu metode ekstraksi fitur yang banyak digunakan adalah metode
autocorrelation. Dalam mengekstraksi fitur dari sekuens protein, autocorrelation
berguna untuk menghitung korelasi antar asam amino dalam setiap sekuens protein
berdasarkan atribut physicochemical tertentu pada masing-masing asam amino
tersebut. Selama ini metode autocorrelation yang digunakan untuk memprediksi
PPI adalah Moran autocorrelation. Hasil prediksinya memiliki akurasi yang baik
saat diterapkan pada beberapa metode klasifikasi. Selain Moran, terdapat dua
metode autocorrelation lain yang memiliki formulasi yang berbeda, yaitu Geary
dan Moreau-Broto. Dalam penelitian ini, dilakukan perbandingan kinerja ketiga
metode autocorrelation tersebut dalam mengekstraksi fitur sekuens protein untuk
memprediksi PPI.
Hasil ekstraksi ketiganya lalu diterapkan pada tiga algoritme machine
learning, yaitu k-Nearest Neighbor (KNN), Random Forest (RF), dan Support
Vector Machine (SVM). Setelah dilakukan pengujian terhadap suatu gugus data,
diketahui bahwa fitur yang dihasilkan oleh ketiga metode autocorrelation tersebut
dapat menghasilkan prediksi dengan tingkat akurasi yang tinggi. Pada KNN, ratarata
akurasi terbaik dari ketiga fitur tersebut mencapai 94%. Adapun pada RF dan
SVM, rataan akurasi terbaiknya mencapai 97% pada hampir semua fitur. Dengan
demikian, dapat disimpulkan bahwa fitur autocorrelation metode Moran, Geary,
dan Moreau-Broto dapat digunakan untuk memprediksi kelas PPI dengan baik. | id |