KAJIAN PENDUGAAN AREA KECIL DENGAN PENDEKATAN MODEL CAMPURAN LOGISTIK KEKAR PADA DATA YANG MENGANDUNG PENCILAN
Abstract
Pendugaan area kecil merupakan teknik statistika yang bertujuan memperoleh penduga pada area (domain) kecil dengan jumlah contoh tidak cukup untuk memperoleh penduga yang reliabel. Salah satu metode pendugaan area kecil yang dapat digunakan adalah pendugaan dengan berbasis model. Dalam pendugaan berbasis model seringkali ditemukan adanya masalah pencilan. Pada model dengan peubah respons kategorik biner ada dua jenis pencilan yaitu pencilan peubah respons dan peubah penyerta. Adanya pencilan pada peubah penyerta akan memengaruhi hasil pendugaan parameter model dengan metode Maximum Likelihood, sehingga diperlukan pemodelan yang kekar terhadap pencilan. Salah satu model pendugaan area kecil kekar terhadap pencilan untuk peubah respons biner adalah Model Campuran Logistik (MCL) Kekar pengembangan dari model logistik kekar dalam Kruschke (2015).
Pendugaan area kecil dengan pendekatan MCL Kekar dapat diterapkan untuk menduga indikator proporsi pengguna internet. Indikator tersebut merupakan salah satu indikator penting dalam SDGs. Sumber data untuk menghitung indikator proporsi pengguna internet bersumber dari Survei Sosial Ekonomi Nasional (Susenas) yang reliabel sampai level kabupaten/kota. Untuk memperoleh nilai proporsi pengguna internet tingkat kecamatan dilakukan pendugaan area kecil.
Dalam penelitian ini dilakukan evaluasi apakah MCL Kekar mampu mengatasi masalah pencilan pada kasus pendugaan area kecil dengan kajian simulasi. Pada kajian simulasi dilakukan pendugaan dengan metode MCL Kekar untuk skenario data kontrol (tanpa pencilan), pencilan peubah respons, pencilan peubah penyerta, serta kombinasinya dengan persentase pencilan 1,3,5,7, dan 10 persen. Dilakukan juga pendugaan area kecil pendekatan MCL dengan pendugaan parameter model metode Maximum Likelihood dan pendekatan Bayesian sebagai pembanding. Sedangkan pada kajian aplikasi dilakukan pendugaan proporsi pengguna internet tingkat kecamatan di Kabupaten Bogor tahun 2020.
Berdasarkan hasil kajian simulasi, evaluasi pendugaan dengan kuadrat tengah galat untuk pendugaan area kecil dengan pendekatan MCL Kekar bernilai konsisten, sehingga dapat dikatakan bahwa pendekatan ini bersifat kekar terhadap pencilan. Selain itu, pada kajian simulasi dan aplikasi diperoleh hasil yang sejalan bahwa metode pendugaan dengan pendekatan MCL Kekar merupakan metode pendugaan area kecil terbaik. Pendugaan dengan pendekatan MCL Kekar menghasilkan nilai dugaan dengan evaluasi rataan kuadrat tengah galat terkecil untuk kajian simulasi dan rataan akar kuadrat tengah galat relatif terkecil untuk kajian aplikasi dibandingkan dengan metode pendugaan langsung dan pendekatan model lainnya. Small area estimation is a statistical technique that aims to obtain an estimator
in a small area (domain) which is not sufficient to obtain a reliable estimator. One
of the small area estimation kinds that can be used in model-based estimation. In
model-based estimation, outliers are often found. In the model with binary
categorical response variables, there are two types of outliers, namely outliers on
the response variable and the auxiliary variable. The existence of outliers in the
auxiliary variables will affect the results of estimating the model parameters with
the Maximum Likelihood method so that robust modelling of the outliers is needed.
One of the small area estimation models which robust against the outliers for the
binary response variable is the Robust Logistic Mixed Model, the development of
the Kruschke (2015) Robust Logistics Model.
Small area estimation using the Robust Logistic Mixed Model approach can
be applied to estimate the indicator of internet users proportion. This indicator is
one of the important indicators in the SDGs. The data source to estimate the
proportion of internet users comes from the National Socio-Economic Survey
(Susenas), which is reliable at the district level. To obtain the proportion of internet
users at the sub-district level, we use the small area estimation method.
In this research, an evaluation was carried out on whether Robust Logistic
Mixed Model could overcome outlier problems in the case of small area estimation
with a simulation study. The simulation study estimated proportion using the
Robust Logistic Mixed Model method in the scenario of control data (without
outlier), outliers of the response variable, outliers of auxiliary variables, and their
combination with the percentage of outliers 1,3,5,7, and 10 percent. The proportion
estimation using Logistic Mixed Model approach with parameter models estimation
using Maximum Likelihood method and Bayesian approach as a comparison. An
application study estimated the internet users' proportion for the sub-district level
in Bogor Regency 2020.
Based on the results of the simulation study, proportion small area estimation
using the Robust Logistic Mixed Model approach resulted in a consistent value of
mean square error, so it can be said that this approach was robust to outliers. In
addition, the simulation and application studies obtained in line with results that
estimation using the Robust Logistic Mixed Model approach was the best small
area estimation method in this research. This approach produced an estimator with
the smallest mean square error for simulation study and the smallest relative root
mean square error for application study compared to other methods.
