Kajian Metode Bayesian Berhierarki pada Pendugaan Area Kecil dengan Peubah Penyerta yang Mengandung Galat Pengukuran
Abstract
Pendugaan area kecil (small area estimation/SAE), merupakan metode yang
dilakukan dengan meminjam kekuatan dari informasi tambahan yang disebut peubah
penyerta. Umumnya, peubah penyerta yang digunakan merupakan pendataan
registrasi seperti sensus dan data administrasi. Hal ini dilakukan karena asumsi
peubah penyerta tersedia untuk setiap area tanpa adanya galat pengukuran sehingga
dapat memperkecil kuadrat tengah galat. Ketersediaan peubah penyerta yang terbatas
seperti data sensus yang tidak tersedia setiap tahunnya dapat menjadi kendala dalam
pendugaan dengan metode SAE. Informasi tambahan dari data survei dapat menjadi
alternatif data dalam permasalahan tersebut. Akan tetapi, peubah penyerta yang
berasal dari survei diasumsikan mengandung galat pengukuran. Oleh karena itu,
diperlukan metode pendugaan area kecil yang dapat mengakomodir adanya
kesalahan dalam pengukuran.
Model SAE with measurement error Ybarra-Lohr (SaeME Ybarra-Lohr)
merupakan salah satu metode SAE yang dikembangkan dari metode SAE Empirical
Best Linear Unbiased Prediction Fay Herrot (SAE EBLUP-FH) untuk
mengakomodir permasalahan peubah penyerta yang mengandung galat pengukuran.
Pengembangan model yang lainnya adalah model SAE with measurement error
Hierarchical Bayesian (SaeME HB), yang dilakukan dengan mengadopsi pendekatan
Bayesian Berhiraki. Penelitian ini membandingkan tiga metode pendugaan area kecil
SAE EBLUP-FH, SaeME Ybarra-Lohr dan SaeME HB. Ketiga metode diterapkan
pada kajian simulasi dan kajian empiris yang peubah penyertanya mengandung galat
pengukuran.
Terdapat dua kajian simulasi yang dilakukan. Pada simulasi pertama
dibangkitkan skenario pada besaran galat pengukuran dan persentase area yang
mengandung galat pengukuran. Hal tersebut bertujuan untuk melihat pendugaan pada
kondisi galat pengukuran yang berbeda di setiap area. Simulasi kedua dibangkitkan
dengan skenario yang berbeda pada peubah penyertanya. Tujuannya adalah untuk
melihat kondisi saat dua peubah penyerta mengandung galat pengukuran dan kondisi
saat salah satu peubah penyerta mengandung galat pengukuran. Pada kajian empiris
dilakukan pendugaan indeks harga konsumen kelompok pengeluaran (IHK-KP)
Januari 2019 di Provinsi Jawa Barat dengan menggunakan peubah penyerta yang
berasal dari data survei, yaitu SUSENAS Maret 2019.
Hasil kajian simulasi menunjukkan bahwa semakin besar nilai ragam pengaruh
acak dan semakin besar nilai galat pengukuran maka kuadrat tengah galat (KTG)
yang dihasilkan semakin besar. Pada simulasi pertama, semakin besar persentase
area yang mengandung galat pengukuran maka pendugaan dengan pendekatan model
SaeME HB adalah lebih baik dibandingkan SAE EBLUP-FH dan SaeME YbarraLohr. Hal ini ditunjukkan dengan KTG yang terkecil. Pada simulasi kedua, skenario
dengan dua peubah penyerta yang mengandung galat pengukuran menghasilkan
KTG yang lebih besar dibandingkan hanya salah satu peubah penyerta yang
mengandung galat pengukuran. Pendekatan model SaeME HB juga memperoleh
KTG yang lebih kecil dibandingkan kedua model lainnya. Pendugaan IHK-KP dalamkajian empiris dengan pendekatan model SaeME Bayes Berhierarki juga
menghasilkan rata-rata akar kuadrat tengah galat relatif (AKTGR) yang lebih kecil
dibandingkan model EBLUP-FH dan SaeME Ybarra-Lohr. Statistik IHK-KP dan
IHK Umum Provinsi Jawa Barat dengan pendekatan SaeME HB mampu
menghasilkan statistik yang mendekati dengan Publikasi BPS In small area estimation (SAE), the method is carried out by borrowing the
strength of additional information (auxiliary variables). Commonly, the auxiliary
variables used are registration data such as census and administrative data. This is
because the assumption of the auxiliary variables is available for all area without any
measurement errors so as to reduce the mean squared error (MSE). The availability
of limited auxiliary variables such as census data which is not available every year
can be an obstacle in estimating with the SAE method. Additional information from
survey can be an alternative data for handling this problem. However, the auxiliary
variables from the survey are assumed to contain measurement errors. Therefore, it is
required small area estimation method that can accommodate measurement errors in
auxiliary variables.
Ybarra-Lohr SAE model with measurement error (Ybarra-Lohr SaeME) is
one of the SAE methods developed from Fay Herrot's SAE empirical best linear
unbiased prediction method (EBLUP-FH) to accommodate auxiliary variables
problems that contain measurement errors. Another model development is the
hierarchical bayesian SAE model with measurement error (HB SaeME), which is
carried out by adopting a hierarchical bayesian approach. This study compared three
small area estimation models, including the EBLUP-FH, Ybarra-Lohr SaeME and
HB SaeME. The three methods are applied to simulation studies and empirical
studies where the auxiliary variables contain measurement errors.
There are two simulation studies conducted. In the first simulation, scenarios
were generated the different of the measurement error and the percentage of areas
containing measurement errors. It aims to see the estimation under different
measurement error conditions in the area. The second simulation is based on a
different scenario on the auxiliary variables. The aim is to analyze conditions when
two auxiliary variables contain measurement errors and conditions when one of the
auxiliary variables contains measurement errors. In an empirical study, an estimation
of the January 2019 expenditure group consumer price index (CPI-EG) in West Java
Province was conducted using auxiliary variables derived from The National
Socioeconomic Survey (SUSENAS).
The results of the simulation study show that the greater the value of the
random effect variances and the greater the measurement error, the greater the mean
square error. In the first simulation, the greater the percentage of areas containing
measurement errors, the better the estimation with the HB SaeME model approach
compared to EBLUP-FH and Ybarra-Lohr SaeME. This is indicated by the smallest
MSE. In the second simulation, a scenario with two auxiliary variables containing
errors resulted in a larger MSE than only one auxiliary variable containing errors.
The HB SaeME model approach also obtains a smaller MSE than the other two
models. CPI-EG estimation in an empirical study using the HB SaeME model
approach also produces a smaller average relative root mean square error (ARRMSE)
compared to the EBLUP-FH and Ybarra-Lohr SaeME models. Statistics of CPI-EGand General CPI of West Java Province with the HB SaeME approach are able to
produce statistics that are close to BPS publications