Pengembangan Model Prediksi Senyawa Antimalaria Menggunakan Pendekatan Machine Learning
Date
2025Author
Prasetya, Fatha Ariya
Kusuma, Wisnu Ananta
Tedjo, Aryo
Metadata
Show full item recordAbstract
Malaria merupakan salah satu penyakit paling mematikan di kawasan tropis dengan tingkat mortalitas yang tinggi akibat infeksi parasit Plasmodium falciparum. Tantangan utama dalam pengendalian malaria adalah munculnya resistensi terhadap obat-obatan antimalaria yang ada. Studi ini bertujuan untuk mengembangkan metode penapisan maya (virtual screening) senyawa herbal antimalaria berbasis machine learning untuk mengidentifikasi kandidat senyawa potensial. Studi ini melakukan perbandingan terhadap tiga algoritma machine learning, yaitu Support Vector Machine (SVM), Extreme Gradient Boosting (XGB), dan Light Gradient Boosting Machine (LGBM). Model model tersebut dilatih menggunakan kombinasi deskriptor molekuler, yakni PubChem Fingerprint dan ECFP. Untuk meningkatkan kinerja prediktif, dilakukan pemilihan fitur menggunakan metode Lasso. Hasil terbaik diperoleh dari model XGB dengan penerapan seleksi Lasso dengan nilai R² sebesar 0.5599, RMSE sebesar 0.3694, dan MAE sebesar 0.2800. Nilai-nilai tersebut mengindikasikan potensi penggunaannya dalam menyaring senyawa-senyawa herbal untuk tahap awal penemuan obat antimalaria. Malaria is one of the deadliest diseases in tropical regions, with a high mortality rate caused by infection with the Plasmodium falciparum parasite. The main challenge in malaria control is the emergence of resistance to existing antimalarial drugs. This study aims to develop a virtual screening method for antimalarial herbal compounds using machine learning to identify potential candidate compounds. The study compares Support Vector Machine (SVM), Extreme Gradient Boosting (XGB), and Light Gradient Boosting Machine (LGBM) as machine learning algorithms. These models were trained using a combination of molecular descriptors, specifically PubChem Fingerprint and ECFP. To improve predictive performance, feature selection was carried out using the Lasso method. The best results were obtained from the XGB model with Lasso selection, achieving an R² of 0.5599, RMSE of 0.3694, and MAE of 0.2800. These values indicate its potential use in screening herbal compounds during the early stages of antimalarial drug discovery.
