Penerapan Partial Least Squares Regression untuk Menduga Kadar Glukosa Darah Non-Invasif dengan Pendekatan Luas Dibagi Jumlah Titik
Abstract
Diabetes mellitus adalah kelainan metabolisme pada tubuh manusia yang tidak dapat memproduksi atau menggunakan insulin dengan baik. Prevalensi diabetes mellitus di Indonesia diperkirakan akan terus meningkat. Data yang digunakan adalah data keluaran alat invasif sebagai peubah respon serta data keluaran alat non-invasif tahun 2019 terdiri dari 50 peubah bebas hasil pemilihan data puncak dan 25 peubah bebas hasil pemilihan data periode. Peubah bebas yang digunakan merupakan hasil peringkasan nilai di bawah grafik residu intensitas terhadap time domain serta jumlah titik yang ada. Alat non-invasif mengeluarkan data berupa spektrum residu intensitas dan time domain. Keluran alat non-invasif tersebut sangat beragam sehingga diperlukan metode peringkasan data untuk menyeragamkan jumlah peubah. Penelitian ini bertujuan melakukan pemilihan data berdasarkan puncak dan periode kemudian melakukan pendekatan beberapa peringkasan yakni peringkasan luas dan peringkasan ide baru yaitu luas dibagi jumlah titik. Partial Least Squares Regression digunakan untuk mengatasi masalah multikolinearitas pada data kalibrasi alat. Hasil penelitian ini diperoleh pemilihan data berdasarkan periode lebih tepat diterapkan pada data yang cenderung fluktuatif. Peringkasan luas dibagi jumlah titik memberikan pendugaan yang lebih akurat karena nilai rataan RMSEP lebih kecil pada sebagian besar skema pemodelan. Diabetes mellitus is a metabolic disorder in the human body that cannot produce or use insulin properly. The prevalence of diabetes mellitus in Indonesia is expected to continue to increase. The data used are invasive tool-output data as dependent variables and non-invasive tool-output data in 2019 consisting of 50 independent variables from peak data and 25 independent variables from period data. The independent variables used result from value residues below the intensity of the time domain and the number of points. Non-invasive tools produce spectrum data of intensity residue and time domains. The output of non-invasive tools is very diverse so data summation method is needed to homogenize the number of variables. This study aims to select data based on peaks and periods and then approach several summations of the graph area summation and the new idea of graph area summation divided by the number of points. Partial Least Squares regression addresses multicollinearity problems on calibration data. The research shows that the data selection based on periods is more appropriately applied to data that tends to fluctuate. The graph area summation divided by the number of points provides a more accurate estimate because of smaller RMSEP on most schemes modeling.