Pendekatan Regresi Kontinum Fungsional Kekar dalam Pemodelan Kalibrasi
Abstract
Kalibrasi peubah ganda merupakan proses menghubungkan sekumpulan data
hasil pengukuran yang relatif mudah dan murah diperoleh dengan sekumpulan data
hasil pengukuran yang sukar dan mahal memperolehnya. Tujuan kalibrasi peubah
ganda berdasarkan sudut pandang statistika adalah menemukan model ??(??) =
??(??), untuk prediksi Y dengan akurasi dan presisi yang tinggi.
Salah satu penerapan kalibrasi dalam bidang kesehatan adalah pemodelan
hubungan antara kadar glukosa darah yang diukur dengan teknik invasif dan noninvasif
berupa spektrum yang menggambarkan sejauh mana cahaya inframerah atau
elektromagnetik diserap oleh molekul-molekul glukosa dalam jaringan kulit. Data
ini mencakup informasi tentang intensitas cahaya pada berbagai panjang
gelombang. Pola spektrum diharapkan dapat menduga kadar glukosa darah.
Teknik yang digunakan untuk mengukur glukosa darah pada alat non-invasif
adalah spektroskopi. Hasil keluaran spektroskopi memungkinkan adanya
pergeseran pencaran, karena objek yang sama diukur beberapa kali tidak tepat
menghasilkan spektrum yang sama. Ukuran objek memiliki pengaruh yang nyata
terhadap spektrum. Spektrum yang keluar sering kali tidak sesuai dengan
semestinya, hal ini terjadi karena pencaran cahaya yang disebabkan sifat fisik
dan kimiawi dari objek yang diamati. Pengaruh yang muncul akibat sifat fisik
dan kimiawi objek dapat menyebabkan penyimpangan cahaya, ketidaklinieran
pencaran, dan ketidakkonsistenan respon. Hal inilah yang mendasari
dibutuhkannya suatu metode prapemrosesan, sehingga diperoleh data yang
konsisten dan mulus (smooth). Berdasarkan hasil kajian literatur diperoleh metode
Wavelet menunjukkan hasil pendugaan model yang lebih baik.
Data fungsional muncul sebagai hasil dari pengukuran atau pengamatan dari
fenomena yang berubah atau bervariasi sepanjang waktu, ruang, atau dimensi
lainnya. Penyebab utama munculnya data fungsional adalah sifat alami dari
fenomena atau proses yang diamati seperti pada teknik spektroskopi. Regresi
kontinum fungsional (RKF) merupakan pengembangan dari regresi kontinum yang
dapat digunakan untuk mengatasi bila jumlah peubah bebas (p) lebih besar daripada
jumlah amatan (p»n) dan data berbentuk fungsional. Pengukuran memungkinkan
adanya nilai-nilai pencilan (outlier) dalam data yang diperoleh, sedangkan RKF
berdasarkan kajian simulasi maupun empirik tidak resisten terhadap pencilan,
sehingga perlu dikembangkan RKF yang kekar (RKFK).
Performa metode dalam mengatasi p»n dan data fungsional, dalam penelitian
ini dieksplorasi terhadap kelima metode yang diklasifikasi menjadi dua bagian,
metode fungsional dan non fungsional. Metode fungsional yang diterapkan yaitu
RKF yang diterapkan dengan mengkombinasikan Wavelet (RKF-Wavelet) dan
Regresi fungsional (RF), sedangkan metode non fungsional yaitu regresi komponen
utama (RKU), regresi kuadrat terkecil parsial (RKTP), dan regresi kuadrat terkecil
(RKT). Performa masing-masing metode dikaji menggunakan data simulasi,
peubah bebas dibangkitkan dari fungsi sinus yang dikolaborasikan dengan
distribusi seragam (uniform) dengan p = 365 dan jumlah pengamatan yang beragam
(n) yaitu 50, 100, dan 200. Kelima metode juga dikaji kekekarannya, dengan teknik
simulasi data, yang dibangkitkan besar persentase bobot pencilan dari 2% hingga
10%.
Hasil kajian simulasi menunjukkan semakin bertambah jumlah data (n)
performa dari kelima metode semakin baik, yang ditunjukkan dengan menurunnya
nilai root mean squares error of prediction (RMSEP) dan mean absolute error
(MAE), serta meningkatkan nilai korelasi antara peubah amatan dan peubah
dugaan. Analisis secara menyeluruh disimpulkan bahwa RKF-Wavelet mempunyai
ukuran kebaikan model yang lebih unggul dibandingkan dengan keempat metode
lainnya.
Penerapan pendekatan RKF-Wavelet pada data pengukuran glukosa darah
memberikan hasil RMSEP 86,57, korelasi 0,1718, MAE 58,11, dan mean absolute
percentage error (MAPE) 41,48. Nilai yang diperoleh lebih kecil dibandingkan
dengan RF, RKU, RKTP dan RKT.
RKFK yang dikembangkan dievaluasi menggunakan data simulasi dan
diperoleh ukuran kebaikan model yang lebih baik dibandingkan kelima metode
RKF, RF, RKU, RKTP, dan RKT. Penerapan RKFK pada data pengukuran glukosa
darah, diperoleh hasil RMSEP 33,25, korelasi 0,92, MAE 16,36, dan MAPE 15,01,
nilai-nilai tersebut lebih baik dibandingkan dengan kelima metode lainnya.
Performa RKFK tergantung pada fungsi pembobotan yang dipilih, sehingga
dalam penelitian ini dilakukan analisis terhadap RKFK dengan empat fungsi
pembobot yang umum digunakan adalah Huber, Hampel, Ramsay, dan Tukey
(Bisquare). Analisis dilakukan dengan mengkaji pada data simulasi dan empirik,
dan diperoleh hasil RKFK dengan fungsi pembobot Huber menunjukkan performa
yang lebih baik dibandingkan dengan tiga fungsi pembobot lainnya.