Paralelisasi Penjajaran Sekuens Protein Menggunakan CUDA untuk Prediksi Drug-Target Interaction (DTI).

Iryanto, Syam Budi

View/Open

Fulltext (13.50Mb)

Date

2019

Author

Iryanto, Syam Budi

Kusuma, Wisnu Ananta

Sadikin, Rifki

Metadata

Show full item record

Abstract

Sampai dengan saat ini, riset mengenai drug discovery masih menghadapi tantangan berupa biaya yang tinggi dan proses yang dianggap belum efisien. Prediksi interaksi drug-target merupakan langkah awal dalam proses drug discovery. Salah satu teknik dalam mempercepat proses tersebut adalah dengan memastikan bahwa suatu drug dapat menyasar suatu target protein tertentu. Oleh karenanya, eksperimen secara in silico mengenai prediksi interaksi drug-target marak dilakukan oleh peneliti. Bipartite Local Model Neighbor-based Interaction-profile Inferring (BLMNII) merupakan salah satu model machine learning yang digunakan untuk melakukan prediksi drug-target. Untuk mendapatkan hasil, BLM-NII memerlukan beberapa skor matriks, antara lain matriks skor kemiripan protein yang digunakan untuk target-target similarity matrix. Untuk mendapatkan skor tersebut, terdapat sebuah dataset publik yang dapat digunakan, misalnya dataset Yamanishi. Akan tetapi, untuk beberapa kasus di mana protein yang hendak dihitung skor kemiripannya tidak terdapat dalam dataset tersebut, seperti protein yang digunakan dalam Ijah Analytics, maka perlu dilakukan perhitungan kembali dengan algoritme penjajaran lokal Smith-Waterman. Sampai dengan saat ini, algoritme ini masih diakui yang paling optimal dalam menghitung skor kemiripan protein. Sayangnya, algoritme ini memiliki kompleksitas kuadratik, sehingga ketika digunakan untuk menghitung skor kemiripan protein dengan jumlah yang banyak memerlukan waktu yang lama. Untuk mempercepat proses komputasi, diperlukan pemrosesan secara paralel. Tujuan penelitian ini adalah untuk mengimplementasikan algoritme Smith- Waterman secara paralel menggunakan CUDA dengan Graphical Processing Unit (GPU) sebagai platform komputasi. Teknik komputasi yang digunakan adalah multiple pairwise alignment di mana penjajaran berpasangan dilakukan berulang kali untuk kombinasi pasangan yang berbeda. Penjajaran setiap residu asam amino dalam tiap pasang sekuens dikerjakan oleh sebuah thread dalam satu blok secara paralel. Setiap pasang sekuens dikerjakan oleh masing-masing blok secara paralel. Uji kinerja dilakukan dengan menghitung speed up, yaitu waktu komputasi paralel dibagi waktu komputasi sekuensial. Proses paralel dilakukan setelah proses awal dilakukan, yaitu: pembuatan list kombinasi pasangan, pembacaan sekuens, perhitungan panjang tiap sekuens, penandaan awal sekuens, dan penggabungan sekuens. Proses paralel dalam implementasi GPU terdapat pada dua tempat, yaitu pada saat penjajaran residu asam amino tiap pasang sekuens protein, dan pada saat penjajaran pasangan sekuens protein. Setiap blok telah memanfaatkan shared memory untuk menyimpan peubah, sehingga proses read dan write bisa lebih cepat. Hasil eksperimen menggunakan mesin 1 berupa laptop menunjukkan nilai speed up hingga 20-an kali, sedangkan mesin 2 yang berupa sebuah server node HPC menunjukkan nilai speed up hingga ratusan kali.

URI

http://repository.ipb.ac.id/handle/123456789/97673

Collections

MT - Mathematics and Natural Science [4149]