Paralelisasi Penjajaran Sekuens Protein Menggunakan CUDA untuk Prediksi Drug-Target Interaction (DTI).
View/ Open
Date
2019Author
Iryanto, Syam Budi
Kusuma, Wisnu Ananta
Sadikin, Rifki
Metadata
Show full item recordAbstract
Sampai dengan saat ini, riset mengenai drug discovery masih menghadapi
tantangan berupa biaya yang tinggi dan proses yang dianggap belum efisien.
Prediksi interaksi drug-target merupakan langkah awal dalam proses drug
discovery. Salah satu teknik dalam mempercepat proses tersebut adalah dengan
memastikan bahwa suatu drug dapat menyasar suatu target protein tertentu. Oleh
karenanya, eksperimen secara in silico mengenai prediksi interaksi drug-target
marak dilakukan oleh peneliti.
Bipartite Local Model Neighbor-based Interaction-profile Inferring (BLMNII)
merupakan salah satu model machine learning yang digunakan untuk
melakukan prediksi drug-target. Untuk mendapatkan hasil, BLM-NII memerlukan
beberapa skor matriks, antara lain matriks skor kemiripan protein yang digunakan
untuk target-target similarity matrix. Untuk mendapatkan skor tersebut, terdapat
sebuah dataset publik yang dapat digunakan, misalnya dataset Yamanishi. Akan
tetapi, untuk beberapa kasus di mana protein yang hendak dihitung skor
kemiripannya tidak terdapat dalam dataset tersebut, seperti protein yang digunakan
dalam Ijah Analytics, maka perlu dilakukan perhitungan kembali dengan algoritme
penjajaran lokal Smith-Waterman. Sampai dengan saat ini, algoritme ini masih
diakui yang paling optimal dalam menghitung skor kemiripan protein. Sayangnya,
algoritme ini memiliki kompleksitas kuadratik, sehingga ketika digunakan untuk
menghitung skor kemiripan protein dengan jumlah yang banyak memerlukan waktu
yang lama. Untuk mempercepat proses komputasi, diperlukan pemrosesan secara
paralel.
Tujuan penelitian ini adalah untuk mengimplementasikan algoritme Smith-
Waterman secara paralel menggunakan CUDA dengan Graphical Processing Unit
(GPU) sebagai platform komputasi. Teknik komputasi yang digunakan adalah
multiple pairwise alignment di mana penjajaran berpasangan dilakukan berulang
kali untuk kombinasi pasangan yang berbeda. Penjajaran setiap residu asam amino
dalam tiap pasang sekuens dikerjakan oleh sebuah thread dalam satu blok secara
paralel. Setiap pasang sekuens dikerjakan oleh masing-masing blok secara paralel.
Uji kinerja dilakukan dengan menghitung speed up, yaitu waktu komputasi paralel
dibagi waktu komputasi sekuensial.
Proses paralel dilakukan setelah proses awal dilakukan, yaitu: pembuatan
list kombinasi pasangan, pembacaan sekuens, perhitungan panjang tiap sekuens,
penandaan awal sekuens, dan penggabungan sekuens. Proses paralel dalam
implementasi GPU terdapat pada dua tempat, yaitu pada saat penjajaran residu
asam amino tiap pasang sekuens protein, dan pada saat penjajaran pasangan
sekuens protein. Setiap blok telah memanfaatkan shared memory untuk menyimpan
peubah, sehingga proses read dan write bisa lebih cepat. Hasil eksperimen
menggunakan mesin 1 berupa laptop menunjukkan nilai speed up hingga 20-an kali,
sedangkan mesin 2 yang berupa sebuah server node HPC menunjukkan nilai speed
up hingga ratusan kali.