MT - Mathematics and Natural Sciencehttp://repository.ipb.ac.id/handle/123456789/772024-03-29T15:45:12Z2024-03-29T15:45:12ZPrediksi Interaksi Drug Target Pada Gen Kanker Menggunakan Metode LASSO-XGBOOSTGinoga, Muh. Fadhil Al-Haaqhttp://repository.ipb.ac.id/handle/123456789/1436972024-03-27T00:05:05Z2024-01-01T00:00:00ZPrediksi Interaksi Drug Target Pada Gen Kanker Menggunakan Metode LASSO-XGBOOST
Ginoga, Muh. Fadhil Al-Haaq
Pengobatan kanker saat ini sering dilakukan dengan kemoterapi menggunakan obat kimia dan dapat menyebabkan efek samping. Alternatif pengobatan dapat menggunakan senyawa herbal yang diketahui memiliki efek samping lebih sedikit. Analisis Drug Target Interaction (DTI) dapat dilakukan untuk mengetahui interaksi senyawa herbal terhadap protein kanker. Pada penelitian ini dilakukan perancangan model prediksi DTI dengan melakukan seleksi fitur pada dataset menggunakan Least Absolute Shrinkage and Selection Operator (LASSO) lalu dilakukan penyeimbangan data dengan Synthetic Minority Oversampling Technique (SMOTE) dan diprediksi menggunakan Extreme Gradient Boosting (XGBoost). Data protein terkait kanker didapatkan dari daftar Cancer Gene Census, dari daftar tersebut dilakukan penelusuran pada database GDSC, DrugCentral, dan DrugBank untuk menghasilkan daftar senyawa obat yang berinteraksi dengan protein tersebut. Selain itu, senyawa herbal dihasilkan dari database HerbalDB dan Knapsack. Pengujian dilakukan pada beberapa jenis ekstraksi fitur seperti CTD, DC, PseAAC, dan PSSM. Hasil prediksi menunjukkan beberapa senyawa herbal seperti andrographolide, ursolic acid dan oleanolic acid memiliki interaksi pada protein terkait kanker. Selain itu, LASSO-XGBoost dapat memprediksi DTI pada kanker dengan skor F1 0,861; AUROC 0,927; recall 0,85; precision 0,866; dan accuracy 0,897.
2024-01-01T00:00:00ZPerbandingan Algoritma BART, Random Forest Dan Hybrid BART-Random Forest Pada Automatic Text SummarizationZamzam, Muhammad Adibhttp://repository.ipb.ac.id/handle/123456789/1428582024-03-22T00:10:29Z2024-01-01T00:00:00ZPerbandingan Algoritma BART, Random Forest Dan Hybrid BART-Random Forest Pada Automatic Text Summarization
Zamzam, Muhammad Adib
Data dan informasi berkembang secara kuantitatif dan kualitatif. Terdapat banyak teks pada internet dan pertumbuhan data menjadi lebih banyak dari yang dibutuhkan. Jumlah dokumen atau teks yang ada pada seluruh sumber sangat besar, maka pekerjaan merangkum menjadi sangat kompleks. Natural Language Processing (NLP) adalah subbidang pada computer science yang membahas pemrosesan dan analisis bahasa manusia. Pembahasan yang umum pada NLP yaitu pemrosesan percakapan, analisis bentuk kalimat, analisis sintaks, diskursus dan pembahasan terkait aplikasi teks seperti perangkuman (summarization), text generation, grammatical correction. Automatic Text Summarization (ATS) adalah salah satu tugas yang menantang pada NLP. ATS sangat sering digunakan pada text mining dan aplikasi analitis seperti information retrieval, information extraction, question answering dan sebagainya. ATS terdiri dari dua cara pendekatan umum yaitu abstraktif, ekstraktif dan hybrid. Pendekatan hybrid melakukan perangkuman dengan kombinasi dari abstraktif dan ekstraktif. Tujuan utama penelitian ini adalah menguji hasil performa algoritma BART dan Random Forest secara independen dan hasil performa secara kombinasinya dalam automatic text summarization. Digunakan algoritma Random Forest pada pendekatan ekstraktif, BART untuk pendekatan abstraktif dan kombinasi BART dan Random Forest untuk pendekatan hybrid. Penelitian menunjukkan bahwa secara individu, skor BART dan RF ROUGE cukup berbeda. Secara berturut-turut skor ROUGE RF pada R1, R2 dan RL adalah 1) 51.45 , 2) 45.52 dan 3) 54.58., skor ROUGE BART adalah 1) 32.78, 2) 16.17 dan 3) 32.19. Secara berturut-turut rata-rata pengukuran F ROUGE RF, BART dan RFxBART adalah 45.73, 21.38 dan 31.31. RF memiliki skor rata-rata tertinggi. ATS Hybrid RFxBART terbukti berkinerja lebih baik daripada BART default, tetapi lebih buruk daripada RF dalam hal skor ROUGE. Rata-rata ROUGE F RFxBART adalah 31,31. RFxBART memiliki skor sedang. Skor ini lebih baik daripada skor ROUGE default BART. RFxBART dapat menjadi alternatif pendekatan hybrid yang efektif.; Data and information grows quantitatively and qualitatively. There is a lot of text on the internet and the growth of data is becoming more than needed. The number of documents or texts contained in all sources is very large, so the work of summarizing becomes very complex. Natural Language Processing (NLP) is a subfield of computer science that discusses the processing and analysis of human language. Common discussions in NLP includes conversation processing, sentence form analysis, syntax analysis, discourse and discussions related to text applications such as summarization, text generation, grammatical correction. Automatic Text Summarization (ATS) is one of the challenging tasks in NLP. ATS is often used in text mining and analytical applications such as information retrieval, information extraction, question answering and so on. ATS consists of two general approaches, which are abstractive, extractive and hybrid. The hybrid approach combines abstractive and extractive to do summarization. The main objective of this research is to test the performance results of the BART and Random Forest algorithms independently and their combined performance results in automatic text summarization. The Random Forest algorithm is used for the extractive approach, BART for the abstractive approach and a combination of BART and Random Forest for the hybrid approach. Research shows that individually, BART and RF ROUGE scores are quite different. Respectively the ROUGE RF scores on R1, R2 and RL are 1) 51.45, 2) 45.52 and 3) 54.58., the ROUGE BART scores are 1) 32.78, 2) 16.17 and 3) 32.19. Average measurements of F ROUGE RF, BART and RFxBART are 45.73, 21.38 and 31.31. RF had the highest average score. ATS Hybrid RFxBART was shown to perform better than default BART, but worse than RF in terms of ROUGE score. RFxBART's average ROUGE F is 31.31. RFxBART has a moderate score. This score is better than BART's default ROUGE score. RFxBART can be an effective alternative hybrid approach.
2024-01-01T00:00:00ZPerbandingan Analisis Diskriminan dan Metode Support Vector Machine Untuk Peubah Bebas Campuran (Kasus Waktu Lama Sembuh Penyakit Covid-19 di Sumatera Barat)Haikal, Husnul Arishttp://repository.ipb.ac.id/handle/123456789/1426702024-03-20T23:45:33Z2024-01-01T00:00:00ZPerbandingan Analisis Diskriminan dan Metode Support Vector Machine Untuk Peubah Bebas Campuran (Kasus Waktu Lama Sembuh Penyakit Covid-19 di Sumatera Barat)
Haikal, Husnul Aris
Metode klasifikasi merupakan metode statistika yang bertujuan untuk memprediksi suatu kelompok data pada kelas kelompok data yang sudah ada, berdasarkan peubah bebas. Ada banyak metode yang dapat digunakan dalam metode klasifikasi, diantaranya adalah analisis diskriminan dan metode support vector machine (SVM). Penggunaan analisis diskriminan pada pemodelan klasifikasi akan bermasalah ketika peubah bebas merupakan peubah bebas campuran kategorik dan kontinu, oleh sebab itu harus diatasi terlebih dahulu. Selain itu penggunaan peubah bebas yang terlalu banyak juga perlu dibatasi dengan melakukan seleksi information value agar terhindar dari terjadinya overfitting. Penggunaan metode klasifikasi juga sering mengalami masalah ketika jumlah data pada kelas peubah respon tidak seimbang (imbalance data) karena dapat menyebabkan kesalahan klasifikasi. Salah satu metode untuk mengatasi hal ini adalah metode resampling, untuk itu tiga metode resampling yaitu undersampling, oversampling, dan Synthetic Minority Oversampling Technique (SMOTE) digunakan pada penelitian ini. Selain itu penggunaan analisis diskriminan dengan peubah bebas campuran kategorik-kontinu, peubah bebas kategoriknya tidak ditransformasi menjadi peubah bebas dummy tetapi digunakan untuk membangun sel (subset data) berdasarkan kombinasi kategori yang ada pada seluruh peubah bebas kategorik yang digunakan dalam model. Selain menggunakan analisis diskriminan, pada penelitian ini juga menggunakan metode support vector machine (SVM). Ide dasar dari metode SVM adalah mencari batas pemisah (hyperplane) yang paling optimal. Hyperplane adalah sebuah fungsi yang dapat memisahkan suatu kelas dengan kelas yang lain dan untuk mengimplementasikan beberapa metode kernel yaitu kernel linear, kernel polynomial dan kernel radial basis function. Terhadap ketiga kernel ini juga dilakukan hypertunning parameter untuk mencari nilai hyperparameter gamma dan C terbaik. Hasil dari pemodelan dibandingkan dan dipilih model terbaiknya berdasarkan nilai balance accuracy terbesar. Pada kedua metode klasifikasi perlu dilakukan evaluasi sebelum digunakan. Kajian studi kasus yaitu data yang memiliki peubah bebas campuran kategorik dan kontinu yang terdiri dari data Titanic Dataset, Coronary Heart Disease dan Indian Liver Patients Record yang bersumber dari Kaggle digunakan dalam evaluasi ini. Hasil membandingkan kedua model klasifikasi pada ketiga data ini menunjukkan bahwa pada data Titanic Dataset, analisis diskriminan dengan metode oversampling merupakan model yang lebih baik dibanding metode SVM kernel linear, karena menghasilkan nilai balance accuracy yang lebih tinggi yaitu sebesar 78.10%. Pada data Coronary Heart Disease, analisis diskriminan tanpa metode resampling merupakan model yang lebih baik dibanding metode SVM kernel radial basis function dengan metode undersampling, karena menghasilkan nilai balance accuracy yang lebih tinggi yaitu sebesar 73.75%. Sementara pada data Indian Liver Patients Record, analisis diskriminan dengan metode resampling SMOTE merupakan model yang lebih baik dari pada metode SVM kernel linear dengan metode SMOTE, karena menghasilkan nilai balance accuracy yang lebih tinggi yaitu sebesar 68.33%. Hasil perbandingan evaluasi model menunjukkan bahwa analisis diskriminan merupakan model yang lebih baik daripada SVM untuk ketiga gugus data yang digunakan. Kajian empiris yang digunakan pada penelitian ini merupakan data waktu lama sembuh penyakit Covid-19 di Sumatera Barat. Peubah bebas kategorik yang digunakan dalam penelitian ini adalah jenis kelamin dan gejala yang dirasakan saat terjangkit Covid-19. Peubah numerik yang digunakan terdiri dari umur, lama waktu gejala Covid-19 menghilang setelah diketahui terjangkit Covid-19, jumlah daun sungkai yang digunakan ketika membuat ramuan daun sungkai, jumlah gelas ketika meminum daun sungkai, jumlah hari dalam mengonsumsi daun sungkai, dan intensitas dalam meminum ramuan daun sungkai per harinya. Hasil seleksi peubah bebas berdasarkan nilai information value menghasilkan bahwa dari delapan peubah bebas terdapat dua peubah bebas yang merupakan prediktor kuat, tiga peubah bebas yang merupakan prediktor sedang, satu peubah bebas yang merupakan prediktor lemah, dan dua peubah bebas yang merupakan peubah bebas yang yang tidak berpengaruh. Selanjutnya peubah bebas yang digunakan adalah peubah bebas yang berkatagori prediktor kuat dan prediktor sedang yaitu umur, lamanya gejala Covid-19 menghilang, lama waktu konsumsi daun sungkai, gejala yang dirasakan saat terkena Covid-19, dan jumlah daun sungkai yang dikonsumsi dalam ramuan. Uji Box’s M terhadap data dilakukan terlebih dahulu agar memenuhi asumsi kesamaan matriks ragam peragam dan menghasilkan nilai P-value sebesar 0.333 sehingga dapat disimpulkan bahwa data memenuhi asumsi kesamaan ragam. Data selanjutnya dibagi menjadi 75% data latih (membangun model dari kedua metode) dan 25% data uji (untuk menguji data yang terbentuk). Analisis diskriminan menghasilkan 4 model yaitu model analisis diskriminan tanpa metode resampling, model analisis diskriminan dengan undersampling, model analisis diskriminan dengan oversampling, model analisis diskriminan dengan SMOTE. Keempat model selanjutnya diuji menggunakan data uji dan diperoleh bahwa model analisis diskriminan dengan SMOTE menghasilkan nilai balanced accuracy tertinggi yaitu sebesar 66,54%. Metode SVM menghasilkan 12 model berdasarkan kernel dan metode resampling. Model SVM kernel linear dan metode resampling SMOTE menghasilkan nilai balanced accuracy tertinggi diantara 12 model yang terbentuk, yaitu sebesar 63,20%. Kedua model terbaik di masingmasing metode dibandingkan sehingga diperoleh kesimpulan bahwa analisis diskriminan dengan SMOTE menghasilkan nilai balanced accuracy tertinggi yaitu sebesar 66,54% dibandingkan model SVM kernel linear dan metode resampling SMOTE yang hanya menghasilkan nilai balanced accuracy sebesar 63,20%. Model terbaik dalam penelitian ini yaitu analisis diskriminan dengan SMOTE menghasilkan tiga model yaitu model ketika gejala yang dirasakan merupakan gejala ringan, gejala sedang dan gejala berat. Model ini sudah cukup baik dalam mengklasifikasikan lama waktu sembuh penyakit Covid-19 di Sumatera Barat karena memiliki nilai balanced accuracy sebesar 66.54%.
2024-01-01T00:00:00ZPerancangan Arsitektur Sistem Informasi Patroli Pencegahan Kebakaran Hutan dan Lahan (SIPP Karhutla) Menggunakan TOGAF ADMHidayat, Fajarhttp://repository.ipb.ac.id/handle/123456789/1426672024-03-20T23:47:39Z2024-03-21T00:00:00ZPerancangan Arsitektur Sistem Informasi Patroli Pencegahan Kebakaran Hutan dan Lahan (SIPP Karhutla) Menggunakan TOGAF ADM
Hidayat, Fajar
Salah satu penyebab terjadinya pengurangan luas hutan setiap tahun di
Indonesia adalah kebakaran hutan dan lahan (karhutla). Berdasarkan data World
Bank (Bank Dunia), total kerugian ekonomi yang dialami negara akibat kebakaran
hutan dan lahan di Indonesia pada tahun 2019 mencapai Rp. 75 trilliun (BNPB
2021). Oleh karena itu pemerintah melalui Kementerian Lingkungan Hidup dan
Kehutanan (KLHK) membentuk organisasi yang diberi nama Manggala Agni.
Manggala Agni merupakan organisasi yang dibentuk untuk melakukan kegiatan
patroli terpadu pencegahan karhutla di Indonesia.
Tim patroli terpadu Manggala Agni masih melakukan pelaporan hasil
kegiatan patroli secara manual melalui grup whatsapp. Oleh karena itu dibangun
aplikasi mobile dan website untuk pelaporan kegiatan patroli karhutla. Sistem ini
masih dalam tahap proses pengembangan dan sudah digunakan untuk dilakukan
pengujian pada patroli terpadu di wilayah Sumatera dan Kalimantan serta saat ini
belum memiliki IT blueprint sistem. Tujuan dari penelitian ini adalah memberikan
rancangan IT blueprint menggunakan The Open Group Architecture Framework
(TOGAF) Architecture Development Method (ADM) untuk pengembangan
teknologi informasi SIPP Karhutla pada jangka panjang.
Tahapan dari penelitian ini yaitu preliminary atau persiapan (perumusan
masalah, penentuan ruang lingkup, prinsip-prinsip perancangan arsitektur
enterprise, komitmen manajemen, dan pengumpulan data), perancangan arsitektur
enterprise menggunakan TOGAF ADM meliputi requirements management,
perancangan architecture vision, perancangan business architecture, perancangan
information system architectures, perancangan technology architecture,
mengidentifikasi opportunities and solutions, dan perancangan migration planning.
Perancangan architecture vision menghasilkan profile, visi dan misi, struktur
organisasi dan tujuan instansi. Perancangan business architecture memberikan
gambaran arsitektur bisnis dengan diagram business process model and notation
(BPMN). Perancangan architecture system information menghasilkan use case
diagram dan class diagram. Perancangan technology architecture dihasilkan
kebutuhan perangkat lunak, perangkat keras, dan jaringan untuk mendukung
penggunaan sistem. Identifikasi opportunities and solutions dihasilkan evaluasi
kesuksesan penggunaan sistem informasi dengan Model Kesuksesan Sistem
Informasi Delone dan Mclean menggunakan skala likert. Perancangan migration
planning dihasilkan jadwal implementasi penggunaan sistem secara bertahap di
setiap wilayah dan sosialisai pelatihan aplikasi.
Hasil penelitian ini menunjukkan bahwa perancangan arsitektur enterprise
menggunakan TOGAF ADM menghasilkan cetak biru (blueprint) dari model
arsitektur yang dibuat. Didapatkan hasil dari evaluasi kesuksesan penggunaan
aplikasi SIPP Karhutla pada indikator kualitas sistem yaitu 85,87 (sangat baik),
kualitas informasi sebesar 88,69 (sangat baik), kualitas layanan sebesar 86,97
(sangat baik), penggunaan sebesar 63,48 (baik), kepuasan pengguna sebesar 87,68
ii
ii
(sangat baik), dan manfaat bersih sebesar 77,79 (sangat baik). Secara umum,
evaluasi kesuksesan sistem informasi yang dihasilkan sudah sangat baik dan
pengembangan aplikasi SIPP Karhutla berbasis website yang telah dilakukan
sebelumnya sudah sesuai dengan kebutuhan pengguna. Penelitian ini dapat
memberikan gambaran IT blueprint berupa Diagram Value Chain dan Diagram
Business Process Modeling Notation (BPMN), Use Case Diagram, Diagram
Activity, Class Diagram, dan usulan perangkat lunak, keras dan jaringan untuk
mendukung aplikasi SIPP Karhutla dan evaluasi penggunaan SIPP Karhutla sebagai
landasan untuk pengembangan arsitektur sistem informasi.
2024-03-21T00:00:00Z