Regresi Kontinum Kekar dalam Pengukuran Kadar Glukosa Darah Non-Invasif
Abstract
Regresi Kontinum Kekar (RKK) diperkenalkan untuk mengatasi masalah
multikolinearitas dengan cara memproyeksikan data asli ke dalam peubah baru
(latent) menggunakan matriks pembobot. RKK menerapkan teknik regresi kekar
(robust) untuk mengatasi masalah pencilan. Beberapa penelitian khususnya bidang
kalibrasi sering ditemukan bahwa jumlah peubah penjelas melebihi jumlah amatan,
dikenal dengan data berdimensi tinggi (?? >> ??). Kondisi ini dapat menyebabkan
struktur matriks peubah penjelas mengalami singularitas dan akan mengalami
kendala dalam aspek komputasi. Tahap awal perlu dilakukan pereduksian dimensi
dengan mempertahankan sebagian besar informasi yang relevan dari data asli,
proses ini disebut prapemrosesan. Analisis Komponen Utama (AKU) merupakan
metode prapemrosesan yang dapat mereduksi dimensi data peubah penjelas (X) dan
mengidentifikasi pola penting tanpa kehilangan banyak informasi. Kelemahan
metode ini sulit untuk menginterpretasi hasil dan tidak secara khusus melakukan
seleksi peubah. Metode Least Absolut Shrinkage and Selection Operator (LASSO)
dapat mengatasinya tetapi sensitif terhadap keberadaan pencilan. WLAD LASSO
diperkenalkan untuk mengatasi pencilan pada peubah respon dan pencilan pada
peubah penjelas dengan memberikan bobot pada nilai absolut dari sisaan regresi.
Penelitian ini bertujuan untuk mengkaji kinerja metode RKK, Regresi
Kontinum Kekar seleksi LASSO (RKK-LASSO) dan Regresi Kontinum Kekar
seleksi WLAD LASSO (RKK-WLAD LASSO) melalui kajian simulasi. Simulasi
dilakukan pada data berdimensi rendah (?? = 75 , ?? = 25) dan data berdimensi
tinggi (?? = 75 , ?? = 100), tanpa pencilan dan dengan pencilan (outlier =
{10%, 15%, 20%}) dan tingkat korelasi (?? = {0,1; 0,5; 0,9}). Nilai ?? optimal
pada RKK antara (0 < ?? < 1) dalam penelitian ini adalah ?? = 0,3. Penduga
Minimum Regularized Covariance Determinant (MRCD) digunakan untuk
menentukan bobot pada WLAD LASSO karena penduga ini bisa digunakan untuk
data berdimensi tinggi dan data berdimensi rendah. Selanjutnya metode diterapkan
dalam pemodelan kalibrasi data pengukuran kadar glukosa darah non-invasif tahun
2019 modulasi 50 sampai 90. Data akan distandarisasi dan dibagi menjadi 80% data
training dan 20% data testing.
Hasil kajian simulasi menunjukkan bahwa pada data berdimensi rendah, rata-rata tingkat kesalahan RKK-LASSO dan RKK lebih rendah dibandingkan dengan
RKK-WLAD LASSO. Korelasi antar peubah penjelas pada ?? = 0,9 menghasilkan
nilai RMSE yang paling kecil dan nilai R2 yang paling besar dalam setiap skenario
tanpa pencilan dan dengan pencilan 10%, 15%. Performa RKK-LASSO, RKK dan
RKK-WLAD LASSO cenderung menurun saat pencilan meningkat (RMSE pada
pencilan 10%, 15%, 20% cenderung lebih tinggi). Hasil simulasi pada data
berdimensi tinggi, rata-rata tingkat kesalahan metode RKK-LASSO cenderung
lebih rendah daripada metode RKK-WLAD LASSO. Korelasi antar peubah
penjelas pada ?? = 0,9 menghasilkan nilai RMSE yang paling kecil dan nilai R2
yang paling besar dalam setiap skenario. Penggunaan RKK pada data berdimensi
tinggi terbatas karena pendugaan parameter mengikuti metode kuadrat terkecil yang
kurang efektif untuk jumlah peubah penjelas yang besar. Metode prapemrosesan,
seperti seleksi peubah menggunakan metode LASSO dan WLAD LASSO perlu
dilakukan.
Hasil kajian aktual data pengukuran kadar glukosa darah non-invasif
menunjukkan adanya pencilan pada peubah respon sekitar 10,81% dan peubah
penjelas sekitar 60,81%. Data ini mengandung multikolinearitas dan merupakan
data berberdimensi rendah. Seleksi peubah dengan validasi silang, diperoleh ?
optimum sebesar 0,1 dengan jumlah peubah terpilih sebanyak 3 pada LASSO dan
2 pada WLAD LASSO. Hasil menunjukkan metode RKK memiliki rata-rata RMSE
terendah sebesar 0,7849 namun rata-rata RMSEP tertinggi sebesar 1,2269. Hasil ini
mengindikasikan bahwa metode RKK sangat baik dalam menyesuaikan data
pelatihan, tetapi kurang efektif dalam memprediksi data baru. RKK-LASSO
memiliki nilai rata-rata RMSEP yang lebih rendah yaitu 0,8928 dibandingkan
dengan RKK-WLAD LASSO dan RKK. Metode RKK-LASSO dengan performa
terbaik dengan nilai RMSEP terendah dan memiliki pola y duga yang lebih mirip
dengan pola y aktual dibandingkan dengan model pada metode RKK-WLAD
LASSO dan RKK.