Perbandingan Metode SMOTE, Borderline-SMOTE, dan ADASYN pada Klasifikasi Data Kadar Gula Darah Non-Invasif dengan Peringkasan Luas
Abstract
Diabetes melitus merupakan penyakit kelainan yang sering disebut sebagai
silent killer. Prevalensi penderita pada tahun 2017 mencapai 8,8% atau 425 juta
orang dan diprediksi pada tahun 2045 mencapai 9,9% atau sekitar 700 juta orang di
dunia. Metode invasif menggunakan glukometer menjadi metode yang paling
sering dijumpai, tapi karena caranya yang melukai jari membuat sedikit
ketidaknyamanan dalam penggunaannya. Tim non-invasif biomarking IPB sedang
melakukan pengembangan metode non-invasif dengan menggunakan alat
spektroskopi inframerah yang menghasilkan output data spektrum residu intensitas.
Data residu intensitas cahaya pada setiap puncak pada amatan dan tiap ulangan
dapat terbaca berbeda sehingga memiliki banyak amatan tidak sama. Perlu
dilakukannya penanganan penyeragaman data, salah satunya peringkasan luas
puncak. Hubungan antara nilai kadar glukosa darah keluaran alat invasif dengan
nilai residu intensitas keluaran alat non-invasif dapat dianalisis menggunakan
metode klasifikasi. Tujuan penggunaan metode klasifikasi adalah untuk melihat
seberapa tepat alat pengukur darah non-invasif dalam mengelompokkan nilai residu
intensitas berdasarkan kelas kadar glukosa darah. Metode klasifikasi sendiri
terkadang mendapatkan kendala berupa data yang tidak seimbang. Perlu dilakukan
penanganan data tidak seimbang, salah satunya dengan Synthetic Minority
Oversampling Technique (SMOTE), Borderline-Synthetic Minority Oversampling
Technique (Borderline-SMOTE), dan Adaptive Synthetic (ADASYN). Klasifikasi
menggunakan model random forest dengan ketiga metode dilakukan untuk
menentukan hasil klasifikasi terbaik. Penelitian bertujuan untuk mengidentifikasi
metode penanganan data tidak seimbang terbaik menggunakan model klasifikasi
random forest. Evaluasi hasil penanganan SMOTE, Borderline-SMOTE, dan
ADASYN menunjukkan penanganan Borderline-SMOTE menghasilkan akurasi
paling tinggi dengan persentase 69,57%. Penanganan SMOTE dianggap memiliki
persentase terkecil dengan 60,87% dan ADASYN menghasilkan akurasi 65,22%.
