Perbandingan Model Klasifikasi pada Data Tak Seimbang Hasil Keluaran Alat Pengukur Kadar Glukosa Darah Non-invasif
Abstract
Diabetes mellitus is one of the most dangerous non-communicable diseases. In 2021, Indonesia is in fifth place with the number of diabetes aged 20-79 years amounting to 19.5 million people. In 2045, the number of diabetes is estimated to increase 28.6 million people. IPB’s Non-Invasive Biomarking team developed a non-invasive blood glucose measuring tool with faster results and without harming the body. This tool uses the principle of infrared spectroscopy. The residual intensity data of each peak in observations and repeats can be read differently so that there are many different observations. Therefore, it is necessary to carry out handling, one of which is area summarization. Classification can be used to analyze the relationship between the class of blood glucose levels from invasive measuring instruments and the residual intensity spectrum from non-invasive measuring instruments. The problem that arises in classification is unbalanced data so it needs to be handled, one of which is Synthetic Minority Oversampling Technique (SMOTE). Comparison of the performance of Random Forest, Support Vector Machines, and eXtreme Gradient Boosting with SMOTE is used to determine the best classification results. This study aims to compare and evaluate the performance of Random Forest, Support Vector Machines, and eXtreme Gradient Boosting with SMOTE in improving the performance of multiclass classification. The classification results show that SMOTE can improve the classification performance. The performance evaluation of the classification method shows that eXtreme Gradient Boosting has the highest accuracy value compared to Random Forest and Support Vector Machines. Diabetes melitus merupakan salah satu penyakit paling berbahaya tidak menular. Pada tahun 2021, Indonesia menempati urutan kelima dengan angka penderita diabetes pada usia 20-79 tahun sebesar 19,5 juta orang. Pada 2045, jumlah penderita diperkirakan mengalami peningkatan menjadi 28,6 juta orang. Tim Non-Invasif Biomarking IPB mengembangan alat pemantauan kadar glukosa darah non-invasif dengan hasil lebih cepat dan tanpa melukai tubuh. Alat ini menggunakan prinsip spektroskopi inframerah. Data residu intensitas setiap puncak pada amatan dan ulangan dapat terbaca berbeda sehingga memiliki banyak amatan tidak sama. Maka dari itu, perlu dilakukan penanganan, salah satunya peringkasan luas. Pemodelan klasifikasi dapat digunakan untuk menganalisis hubungan antara kelas kadar glukosa darah hasil alat ukur invasif dengan spektrum residu intensitas hasil alat ukur non-invasif. Permasalahan yang sering timbul pada pemodelan klasifikasi yaitu data tidak seimbang sehingga perlu dilakukan penanganan, salah satunya Synthetic Minority Oversampling Technique (SMOTE). Perbandingan kinerja Random Forest, Support Vector Machines, dan eXtreme Gradient Boosting dengan penanganan SMOTE digunakan untuk menentukan hasil klasifikasi terbaik. Penelitian ini bertujuan untuk membandingkan dan mengevaluasi kinerja Random Forest, Support Vector Machines, dan eXtreme Gradient Boosting dengan penanganan data Synthetic Minority Oversampling Technique (SMOTE) dalam meningkatkan kinerja klasifikasi multikelas. Dari hasil klasifikasi menunjukkan bahwa SMOTE dapat meningkatkan kinerja klasifikasi. Evaluasi kinerja dari metode klasifikasi tersebut menunjukkan bahwa eXtreme Gradient Boosting memiliki nilai akurasi paling tinggi dibandingkan dengan Random Forest dan Support Vector Machines
