View Item 
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Mathematics and Natural Science
      • View Item
      •   IPB Repository
      • Dissertations and Theses
      • Master Theses
      • MT - Mathematics and Natural Science
      • View Item
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      Optimasi Model DSSL-DTI dalam Prediksi Senyawa Herbal untuk Penyakit COVID-19 Menggunakan Algoritma Genetika

      Thumbnail
      View/Open
      Cover (480.9Kb)
      Fulltext (1.407Mb)
      Lampiran (369.9Kb)
      Date
      2024
      Author
      Wijaya, Eko Praja Hamid
      Kusuma, Wisnu Ananta
      Wijaya, Sony Hartono
      Metadata
      Show full item record
      Abstract
      EKO PRAJA HAMID WIJAYA. Optimasi Model DSSL-DTI dalam Prediksi Senyawa Herbal untuk Penyakit COVID-19 Menggunakan Algoritma Genetika. Dibimbing oleh WISNU ANANTA KUSUMA dan SONY HARTONO WIJAYA. COVID-19 adalah penyakit dengan laju penyebaran yang tinggi. Hal ini membuat percepatan dalam proses penemuan obat untuk penyakit ini sangat dibutuhkan. Penggunaan kembali obat (drug repurposing) merupakan salah satu alternatif dalam pengembangan dan penemuan obat dengan biaya murah serta waktu yang singkat. Dibandingkan dengan obat konvensional, tanaman herbal dapat digunakan sebagai obat yang memiliki khasiat yang lebih baik, efek samping yang lebih sedikit, dan lebih murah. Senyawa herbal yang terkandung dalam tanaman obat memiliki peluang besar dalam pengobatan penyakit COVID-19. Eksplorasi senyawa herbal potensial dapat dilakukan dengan memprediksi interaksi obat target dan penggunaan kembali obat. Namun, prediksi interaksi obat-target menggunakan pendekatan klasifikasi biner memiliki kelemahan, yaitu cenderung mengabaikan kemungkinan adanya hubungan antar label yang dapat membawa informasi penting untuk meningkatkan akurasi prediksi. Oleh karena itu, untuk menemukan kemungkinan adanya hubungan antar label sehingga akurasi prediksi model menjadi lebih optimal diperlukan sebuah pendekatan dengan model yang dioptimasi. Penelitian ini bertujuan untuk mengidentifikasi kemungkinan adanya hubungan antar label dalam prediksi senyawa herbal potensial untuk penyakit COVID-19 melalui penerapan metode klasifikasi multilabel dengan model yang dioptimasi menggunakan Algoritma Genetika (SAE-DNN-GA) sehingga akurasi prediksi model menjadi lebih optimal. Tahapan penelitian ini terdiri atas identifikasi masalah dan solusi, praproses data, pembangunan model, pengujian dan evaluasi, serta prediksi dan analisis. Data yang digunakan dalam penelitian ini adalah data protein, interaksi senyawa-protein, dan senyawa herbal. Data protein diperoleh dari situs GeneCards yang berisi kumpulan protein yang berasosiasi dengan COVID-19 dan ditemukan pada manusia. Data interaksi senyawa-protein diperoleh dari situs DrugBank dan SuperTarget. Data senyawa herbal diperoleh dari HerbalDB. Data tersebut menjalani praproses untuk memastikan kualitas dan konsistensi sehingga dapat digunakan secara efektif dalam analisis dan pengembangan model. Tahapan pembangunan model dilakukan dengan pendekatan klasifikasi multilabel menggunakan metode deep semi-supervised learning (DSSL). Metode ini terdiri atas dua tahap utama, yaitu tahap unsupervised learning sebagai prapelatihan dengan melatih model stacked atoencoder (SAE) untuk inisialisasi bobot awal yang akan digunakan pada pemodelan deep neural network (DNN), dan tahap supervised learning sebagai pemodelan DNN untuk proses prediksi. Selanjutnya optimasi hyperparameter dilakukan untuk mencari kombinasi hyperparameter optimal yang diharapkan dapat meningkatkan performa model SAE-DNN. Pada tahap pengujian dan evaluasi dilakukan uji model menggunakan data senyawa herbal yang berasal dari situs HerbalDB dan hasil pengujian dievaluasi menggunakan iterative stratification. Perbandingan performa model menunjukkan bahwa model setelah dioptimasi lebih baik dalam prediksi kelas multilabel (accuracy lebih tinggi), lebih baik dalam prediksi kelas positif dari setiap label (recall lebih tinggi), lebih baik dalam prediksi positif tiap label (precision lebih tinggi), serta kelas minoritas dapat dikenali dengan lebih baik (f-measure lebih tinggi). Selanjutnya pada tahap akhir dilakukan prediksi interaksi senyawa herbal terhadap himpunan protein target menggunakan model SAE-DNN dengan hyperparameter optimal yang diperoleh dari hasil evaluasi model. Hasil penelitian menunjukkan bahwa dengan menggunakan SAE-DNN-GA, prediksi senyawa herbal menghasilkan sepuluh senyawa yang berinteraksi dengan dua protein bernilai relevansi tertinggi, yaitu protein Insulin (7,094) dan Albumin (3,178). Hasil ini menunjukkan bahwa prediksi kandidat senyawa herbal sebagai obat penyakit COVID-19 dapat menjadi lebih akurat.
       
      EKO PRAJA HAMID WIJAYA. DSSL-DTI Model Optimization in Predicting Herbal Compounds for COVID-19 Disease Using Genetic Algorithm. Supervised by WISNU ANANTA KUSUMA and SONY HARTONO WIJAYA. COVID-19 is a disease with a high spread rate. This makes an acceleration in the process of finding drugs for this disease very necessary. Reusing drugs (drug repurposing) is an alternative to drug development and discovery at a low cost and in a short time. Compared to conventional medicines, herbal plants can be used as medicines that have better efficacy, fewer side effects, and are cheaper. Herbal compounds contained in medicinal plants have great opportunities for treating COVID-19. Potential herbal compounds can be explored by predicting target drug interactions and drug reuse. However, the prediction of drug-target interactions using a binary classification approach is weak and needs to be improved: it tends to ignore the possibility of relationships between labels that can carry important information to increase prediction accuracy. Therefore, an approach with an optimized model is necessary to uncover potential relationships between labels, thereby enhancing the accuracy of model predictions. This research aims to identify possible relationships between labels in the prediction of potential herbal compounds for COVID-19 disease through the application of a multilabel classification method with a model optimized using the Genetic Algorithm (SAE-DNN-GA) so that the accuracy of the model predictions becomes more optimal. This research stage involves identifying problems and solutions, data preprocessing, model building, testing and evaluation, and prediction and analysis. The data used in this research are protein data, protein-compound interactions, and herbal compounds. Protein data was obtained from the GeneCards website, which contains a collection of proteins associated with COVID-19 and found in humans. Compound-protein interaction data was obtained from the DrugBank and SuperTarget sites, and herbal compound data was obtained from HerbalDB. The data undergoes preprocessing to ensure quality and consistency to be used effectively in analysis and model development. The model-building stages were carried out using a multilabel classification approach and the deep semi-supervised learning (DSSL) method. This method consists of two main stages, namely the unsupervised learning stage as pre-training by training the stacked autoencoder (SAE) model to initialize the initial weights that will be used in deep neural network (DNN) modelling and the supervised learning stage as DNN modelling for the prediction process. Next, hyperparameter optimization is carried out to find the optimal hyperparameter combination, which is expected to improve the performance of the SAE-DNN model. At the testing and evaluation stage, a model test was carried out using herbal compound data originating from the HerbalDB site and the test results were evaluated using iterative stratification. Comparison of model performance shows that the model after optimization is better at predicting multilabel classes (higher accuracy), better at predicting the positive class of each label (higher recall), better at predicting positives for each label (higher precision), and minority classes can be recognized better (higher f-measure). Next, in the final stage, predictions of the interaction of herbal compounds with the set of target proteins are carried out using the SAE-DNN model with optimal hyperparameters obtained from the model evaluation results. The results showed that using SAE-DNN-GA, the prediction of herbal compounds produced ten compounds interacting with two proteins with the highest relevance values, namely Insulin (7.094) and Albumin (3.178) proteins. These results show that predictions of candidate herbal compounds as drugs for COVID-19 can be more accurate.
       
      URI
      http://repository.ipb.ac.id/handle/123456789/156858
      Collections
      • MT - Mathematics and Natural Science [4149]

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository
        

       

      Browse

      All of IPB RepositoryCollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

      My Account

      Login

      Application

      google store

      Copyright © 2020 Library of IPB University
      All rights reserved
      Contact Us | Send Feedback
      Indonesia DSpace Group 
      IPB University Scientific Repository
      UIN Syarif Hidayatullah Institutional Repository
      Universitas Jember Digital Repository