Pendeteksian dan Penanganan Pencilan pada Model Spasial Autoregresif
View/ Open
Date
2019Author
Mastuti, Winda Chairani
Djuraidah, Anik
Erfiani
Metadata
Show full item recordAbstract
Data spasial merupakan data yang memiliki informasi geografis. Analisis regresi spasial digunakan untuk memodelkan hubungan peubah respon dan peubah penjelas pada data spasial dengan memerhatikan pengaruh pasial. Pada data spasial terdapat dua macam efek spasial yaitu dependensi spasial dan keragaman spasial. Model dependensi spasial pada peubah respon adalah model spasial autoregresif (SAR).
Salah satu permasalahan dalam model regresi spasial adalah keberadaan data pencilan. Data pencilan didefinisikan sebagai nilai amatan yang jauh berbeda dari amatan lainnya. Koefisien regresi dan tanda dalam koefisien regresi dapat berubah karena keberadaan pencilan. Ragam sisaan juga dapat semakin membesar karena adanya pencilan. Pendugaan koefisien regresi tanpa deteksi pencilan dapat mengakibatkan kesalahan pada pengambilan keputusan.
Pendeteksian pencilan spasial dapat dilakukan dengan beberapa cara. Salah satunya adalah dengan menggunakan score test statistik yang perhitungannya diturunkan dari mean shift outlier model. Nilai score test dapat diturunkan sesuai model spasial yang digunakan.
Metode untuk mengatasi pencilan tanpa menghapus amatan tersebut adalah dengan melakukan pemodelan regresi kekar. Metode ini dilakukan dengan melakukan pembobotan dalam menduga parameternya. Salah satu pembobotan yang digunakan adalah metode penduga-S. Penduga-S bertujuan untuk memperoleh penduga dengan nilai simpangan baku minimum. Metode ini memiliki nilai breakdown point terbesar pada model regresi. Metode ini mengatasi pencilan pada data dengan melakukan pembobotan yang nilainya ditentukan berdasarkan simpangan baku sisaannya. Pada penelitian ini, penduga S diterapkan pada model SAR. Pendugaan parameter dilakukan secara iteratif dengan fungsi pembobot iteratively reweighted least squares (IRLS).
Penelitian bertujuan untuk mengkaji pendugaan parameter model regresi spasial yang memiliki amatan pencilan dengan metode penduga-S pada data simulasi dan menerapkannya pada data PAD Jawa tahun 2017. Data simulasi dilakukan dengan lima jumlah amatan berbeda yaitu 30, 90, 120, 180, dan 360 serta dua matriks pembobot spasial yaitu circular world dan queen contiguity. Pencilan yang dibangkitkan pada data sebanyak 1%, 3%, 5%, dan 10%. Evaluasi kebaikan penduga dilihat berdasarkan nilai bias yang disajikan dengan diagram kotak garis. Penerapan metode Spasial Autoregresif Kekar (SARK) dilakukan pada data PAD Jawa tahun 2017 dengan empat matriks pembobot spasial yaitu k-tetangga terdekat (k-nearest neighbor) dengan k=4, queen contiguity, bobot eksponensial (exponential weight), dan invers jarak (invers distance). Peubah-peubah penjelas yang digunakan adalah jumlah penduduk, dana alokasi umum (DAU), produk domestik regional bruto (PDRB) , jumlah restoran, dan jumlah hotel.
Simulasi model SARK dengan bobot circular world dan queen contiguity baik digunakan pada saat nilai penduga ���������� bernilai positif namun nilai parameter ���������� berkisar kurang dari 0.8. Penduga ini baik digunakan untuk semua nilai pencilan kecuali pada saat ���������� kecil yaitu ����������=30 yang baik digunakan pada saat nilai pencilan
lebih dari 5%. Berdasarkan matriks bobot yang digunakan, matriks circular world memiliki keragaman yang lebih besar dibandingkan matriks queen contiguity.
Hasil eksplorasi PAD kabupaten/kota di Jawa tahun 2017 dengan indeks Moran menunjukkan bahwa terdapat autokorelasi spasial yang positif pada data. Daerah yang berdekatan memiliki nilai PAD yang tidak jauh berbeda. Hasil pengujian ragam sisaan menunjukkan ragam sisaan yang homogen sehingga model SAR dapat diterapkan. Setelah dilakukannya pemodelan SAR, dilakukan pendeteksian pencilan dengan menghitung score test. Hasil ini menunjukkan bahwa terdapat lokasi yang dideteksi sebagai pencilan pada data.
Model SARK dengan penduga-S diterapkan pada data yang mengandung pencilan. Berdasarkan empat matriks pembobot yang digunakan, model SARK dengan bobot k-tetangga terdekat memberikan nilai median absolute deviation dan median absolute percentage error yang lebih kecil. Model SARK memberikan empat peubah yang berpengaruh pada PAD Jawa yaitu jumlah penduduk, DAU, PDRB, dan jumlah restoran.