Pendugaan Area Kecil Rata-rata Lama Sekolah di Kabupaten Bogor dengan Pendekatan Semiparametrik P-Spline
Abstract
Kebutuhan akan data dan informasi untuk wilayah yang lebih kecil semakin tinggi, sementara penyediaan data untuk wilayah kecil seringkali terkendala karena terbatasnya jumlah contoh pada kegiatan survei. Pendugaan secara tidak langsung menggunakan Small Area Estimation (SAE) dapat digunakan untuk mengatasi permasalahan tersebut.
Penelitian ini bertujuan untuk menerapkan model SAE berbasis level area yaitu semiparametrik Fay-Herriot dengan pendekatan spline terpenalti (P-Spline) dalam menduga angka rata-rata lama sekolah (RLS) tingkat kecamatan di Kabupaten Bogor. Model Fay-Herriot (FH) dengan metode pendugaan EBLUP (Empirical Best Linear Unbiased Prediction) dianggap kurang fleksibel dalam menyesuaikan pola data hasil survei karena adanya asumsi linearitas. Model semiparametrik FH merupakan modifikasi dari model FH saat asumsi linearitas tidak terpenuhi, dimana pendekatan ini mampu mencakup tidak hanya komponen parametrik tetapi juga komponen nonparametrik. Penelitian ini juga mempertimbangkan pengaruh acak korelasi spasial untuk dimasukkan ke dalam model SAE, atau yang dikenal dengan metode SEBLUP (Spatial Empirical Best Linear Unbiased Predictor), dengan pertimbangan bahwa pada umumnya kondisi di suatu area dipengaruhi oleh area sekitarnya.
Data RLS yang digunakan bersumber dari hasil SUSENAS Kor 2019, sedangkan data peubah penyerta bersumber dari publikasi Kabupaten Bogor dalam Angka serta PODES 2018. Peubah penyerta yang digunakan dalam penelitian ini sebanyak lima peubah yaitu persentase keluarga pertanian, jumlah warga peserta BPJS kesehatan PBI, jumlah desa yang memiliki sekolah, kepadatan penduduk, dan laju pertumbuhan penduduk. Hasil identifikasi menunjukkan bahwa terdapat satu peubah yang dideteksi tidak berkorelasi linear dengan RLS, yaitu peubah laju pertumbuhan penduduk, sehingga terdapat tiga model SAE yang akan dibangun. Model 1 yaitu model FH dengan lima peubah penyerta, model 2 yaitu model semiparametrik FH dengan empat peubah penyerta parametrik dan satu peubah penyerta nonparametrik, serta model 3 yaitu menambahkan informasi spasial ke dalam model 2 yang selanjutnya disebut model spasial semiparametrik FH. Hasil pendugaan ketiga model tersebut dievaluasi menggunakan relative root mean squared error (RRMSE).
Pemilihan model spline serta banyaknya knot yang digunakan didasarkan pada nilai GCV, dimana model spline kubik dengan tiga knot menghasilkan nilai GCV minimum, sehingga pendekatan ini yang akan diterapkan pada model 2. Uji autokorelasi spasial menggunakan uji Moran menghasilkan kesimpulan bahwa terdapat autokorelasi spasial nilai RLS kecamatan di Kabupaten Bogor, sehingga cukup beralasan untuk melakukan pendugaan RLS tingkat kecamatan dengan memasukkan pendekatan spasial dalam pendugaanya.
Hasil analisis data menunjukkan bahwa pendugaan RLS menggunakan model 2 melalui pendekatan spline kubik dengan tiga knot mampu menghasilkan rataan RRMSE yang lebih kecil dibandingkan model 1. Hasil tersebut menunjukkan bahwa modifikasi model FH dengan pendekatan semiparametrik P-Spline lebih baik dalam menduga RLS level kecamatan di Kabupaten Bogor. Model 3 menghasilkan nilai dugaan RLS kecamatan yang tidak jauh berbeda dengan hasil dugaan pada model 2. Nilai dugaan rataan RRMSE yang dihasilkan juga tidak lebih baik daripada rataan RRMSE model 2, dengan demikian penambahan efek spasial ke dalam pendugaan area kecil belum mampu memperbaiki nilai dugaan RLS hasil semiparametrik FH dengan pendekatan P-Spline.