Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/137246
Title: Prediksi Efek Samping Obat Tuberkulosis Menggunakan Klasifikasi Multilabel dengan Random Forest
Other Titles: Prediction of Tuberculosis Drug Side-Effects Using Multilabel Classification with Random Forest
Authors: Kusuma, Wisnu Ananta
Mushthofa, Mushthofa
Handayani, Raden Rara Diah
Helma, Siti Syahidatul
Issue Date: 2024
Publisher: IPB University
Abstract: Tuberkulosis (TB) merupakan penyakit menular yang disebabkan oleh bakteri Mycobacterium tuberculosis yang dapat menjangkiti paru-paru penderitanya. Perkembangan TB resistan obat (TB-RO) telah menjadi perhatian karena sifat resistensinya terhadap obat anti-TB (OAT) dan dapat memberikan efek samping pada pasien. Penelitian ini bertujuan untuk memprediksi efek samping obat menggunakan pendekatan klasifikasi multilabel dengan algoritma Random Forest (RF). Penelitian ini menggunakan data rekam medis yang terdiri dari rejimen paduan OAT yang dikonsumsi oleh pasien dan efek samping OAT yang dialami oleh pasien dari Rumah Sakit Umum Pusat (RSUP) Persahabatan Jakarta yang merupakan Rumah Sakit pusat rujukan TB-RO nasional. Model dilatih dengan menggunakan parameter terbaik berdasarkan hasil dari proses hyperparameter tuning dengan menerapkan teknik grid search. Selanjutnya dilakukan evaluasi dengan beberapa metrik performa untuk menentukan model yang optimal, yakni akurasi, recall, precision, hamming loss, F1-score, Fβ, kurva ROC, dan skor AUC. Hasil penelitian menunjukkan algoritma multilabel RF dapat dijadikan alternatif untuk membangun model prediksi efek samping OAT yang menghasilkan nilai performa paling optimal di antara model DT dan XGBoost. Metrik akurasi dan hamming loss terbaik dihasilkan oleh model multilabel RF classifier chain, sedangkan F1-score, recall, dan Fβ terbaik dihasilkan oleh model multilabel RF label powerset. Adapun skor AUC seluruh model multilabel RF berada di atas 0,8 yang berarti keseluruhan model multilabel RF dianggap baik dan dapat diterapkan untuk prediksi efek samping OAT. Terdapat delapan obat yang memiliki tingkat pengaruh tinggi terhadap model prediksi efek samping OAT berdasarkan skor feature importance yakni Clofazimine, Bedaquiline, Kanamisin, Levofloksasin, Moxifloksasin, Linezolid, Sikloserin, dan Etambutol dengan rata-rata skor besar atau sama dengan 0,1. Meskipun begitu, OAT dengan skor yang tinggi tidak sepenuhnya bermakna dapat menyebabkan efek samping, karena pembentukan tree dalam RF dipengaruhi oleh penggunaan sampel dan fitur secara acak (dengan penggantian), serta distribusi dan variasi nilai-nilai suatu fitur dalam data pelatihan. Penelitian ini diharapkan dapat membantu mengidentifikasi efek samping obat TB-RO berdasarkan data paduan OAT yang dikonsumsi oleh pasien dan menentukan algoritma machine learning berbasis tree yang paling potensial untuk memprediksi efek samping OAT berdasarkan hasil evaluasi algoritma.
Tuberculosis (TB) is an infectious disease caused by Mycobacterium tuberculosis that can infect the lungs. The development of drug-resistant TB (MDR-TB) has become a concern due to its resistance to anti-TB drugs (ATD), which can have side effects on patients. This study aims to predict drug side effects using a multilabel classification approach with the Random Forest (RF) algorithm. This study used medical record data consisting of ATD alloy regimens consumed by patients and ATD side effects experienced by patients from the Friendship Central General Hospital (RSUP), a national TB-RO referral center hospital in Jakarta. The model was trained using the best parameters based on the results of the hyperparameter tuning process by applying the grid search technique. Several performance metrics were then evaluated to determine the optimal model: accuracy, recall, precision, hamming loss, F1-score, Fβ, ROC curve, and AUC score. The results show that the RF multilabel algorithm can be an alternative for building OAT side effect prediction models because it produces the most optimal performance value among DT and XGBoost models. The best accuracy and hamming loss metrics are generated in the multilabel RF classifier chain model, while the best F1-score, recall, and Fβ are generated by the multilabel RF label powerset model. Meanwhile, the AUC score of all RF multilabel models is above 0.8, meaning that all RF multilabel models are suitable and can be applied for ATD side effect prediction. Eight drugs have the highest influence on the OAT side effect prediction model based on the feature importance score, namely Clofazimine, Bedaquiline, Kanamycin, Levofloxacin, Moxifloxacin, Linezolid, Cycloserine, and Etambutol with an average score greater than or equal to 0.1. However, high-scoring OATs do not necessarily mean that they cause side effects, as tree formation in RF is affected by the use of random samples and features (with replacement), as well as the distribution and variation of feature values in the training data. This study is expected to help identify the side effects of TB-RO drugs based on ATD alloy data consumed by patients and determine the most potential tree-based machine learning algorithm to predict ATD side effects based on algorithm evaluation results.
URI: http://repository.ipb.ac.id/handle/123456789/137246
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
THESIS-Mahasiswa Pasca Kom Siti Syahidatul Helma G6501211002-cover.pdf
  Restricted Access
Cover932.6 kBAdobe PDFView/Open
THESIS-Mahasiswa Pasca Kom Siti Syahidatul Helma G6501211002-full text.pdf
  Restricted Access
Fulltext2.22 MBAdobe PDFView/Open
THESIS-Mahasiswa Pasca Kom Siti Syahidatul Helma G6501211002-signed-lampiran.pdf
  Restricted Access
Lampiran697.52 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.