Model Kekar Improved Geographically and Temporally Weighted Regression dalam Pemodelan PDRB Kabupaten/kota di Provinsi Jawa Barat Tahun 2018-2022.
Abstract
Analisis regresi digunakan untuk memprediksi peubah respons atau mengidentifikasi hubungan antara peubah penjelas dengan peubah respons. Selain itu, dalam beberapa penelitian, analisis regresi juga mempertimbangkan aspek lokasi karena adanya hubungan spasial antar objek/lokasi, di mana keragaman lokasi menyebabkan perbedaan data atau fenomena yang digambarkan dengan persamaan regresi yang berbeda. Metode geographically weighted regression (GWR) digunakan untuk memodelkan keragaman spasial dengan pembobotan berdasarkan jarak geografis lokasi sehingga setiap lokasi memiliki nilai penduga parameter yang berbeda. GWR umumnya diterapkan pada data yang diamati dari banyak lokasi pada satu waktu. Data spasial-temporal mencakup pengamatan dari banyak lokasi dan waktu berbeda sehingga metode GWR dikembangkan menjadi geographically and temporally weighted regression (GTWR), yang mempertimbangkan aspek lokasi dan waktu. Namun, model GTWR memiliki keterbatasan karena jarak ruang tidak memengaruhi jarak waktu sehingga disempurnakan menjadi improved geographically and temporally weighted regression (I-GTWR) dengan menambahkan pembobotan interaksi pada fungsi jarak spasial-temporal untuk meningkatkan representasi model.
Penduga parameter pada metode I-GTWR menggunakan metode kuadrat terkecil (MKT) yang sensitif terhadap keberadaaan pencilan. Pencilan sering kali mengandung informasi berharga sehingga tidak boleh dihilangkan begitu saja, tetapi dampaknya terhadap model harus diminimalkan agar penduga parameter lebih stabil dan akurat. Penelitian ini mengkaji kinerja model I-GTWR pada data yang mengandung pencilan sehingga model yang dihasilkan lebih kekar terhadap dampak dari pencilan. Metode penduga kekar yang digunakan untuk mengurangi dampak pencilan adalah metode regresi kekar S-estimator, M-estimator, dan Multi- Stage Method (MM-estimator).
Perbandingan dilakukan pada data simulasi dengan skenario khusus yang dirancang mempertimbangkan posisi dan persentase pencilan, serta bagaimana pencilan tersebut diatasi menggunakan metode I-GTWR dan I-GTWR kekar dengan S-estimator, M-estimator, dan MM-estimator. Setiap skenario diulang sebanyak 100 kali sehingga menghasilkan 100 ukuran kebaikan model untuk masing-masing skenario. Skenario-skenario tersebut dirancang untuk mengevaluasi seberapa efektif penambahan metode pemduga kekar dalam meningkatkan kinerja model, terutama dalam konteks mengurangi dampak negatif dari pencilan pada hasil prediksi.
Hasil kajian simulasi menunjukkan penambahan S-estimator, M-estimator dan MM-estimator pada metode I-GTWR menghasilkan model yang lebih baik jika dibandingkan dengan model I-GTWR standar. Penambahan ketiga metode penduga kekar tersebut tidak menunjukkan adanya perbedaan signifikan sehingga penggunaan salah satu dari ketiganya sudah cukup untuk meningkatkan kinerja model. Faktor posisi dan persentase pencilan memengaruhi performa model. Model
I-GTWR kekar efektif mengatasi pencilan, terutama saat pencilan tersebar teratur seperti pada posisi atas ataupun bawah. Namun, untuk faktor persentase pencilan yang diterapkan pada semua metode, baik kekar maupun standar, kesimpulan mengenai kapan akurasi model meningkat atau menurun tidak dapat ditarik secara spesifik.
Penambahan S-estimator, M-estimator, dan MM-estimator diterapkan pada kajian empiris untuk memastikan model terbaik digunakan untuk menangani pencilan secara efektif pada data PDRB kabupaten/kota di Provinsi Jawa Barat periode 2018-2022 dengan mempertimbangkan aspek spasial-temporal. Model I- GTWR kekar dengan MM-estimator secara konsisten menunjukkan performa terbaik dengan memberikan nilai evaluasi akurasi yang lebih baik dibandingkan model I-GTWR dengan metode pendugaan kekar lainnya sehingga menjadi pilihan paling optimal untuk memodelkan PDRB di Provinsi Jawa Barat pada periode 2018-2022. Hasil pendugaan parameter PDRB dengan peubah yang memengaruhi menunjukkan hasil yang beragam pada setiap daerah dan setiap waktu. Secara keseluruhan, kajian empiris menunjukan bahwa peubah PAD (X1), DAU (X2), dan PMA (X3) secara konsisten menjadi faktor utama yang memengaruhi PDRB di kabupaten/kota Jawa Barat selama 2018-2022, sementara faktor kemiskinan (X6) hanya signifikan pada 2019. Perkembangan ekonomi di Provinsi Jawa Barat menunjukkan transformasi dari ketergantungan pada pendapatan lokal dan investasi asing pada 2018 menjadi struktur ekonomi yang lebih beragam dan kompleks pada 2022. Regression analysis predicts response variables or identifies the relationship between explanatory variables and response variables. In addition, in some studies, regression analysis also considers aspects of location due to the spatial relationship between objects/locations, where location diversity causes differences in data or phenomena described by different regression equations. The geographically weighted regression (GWR) method is used to model spatial diversity by weighting based on the geographical distance of the location so that each location has a different parameter estimation value. GWR is generally applied to data observed from many locations at one time. Spatial-temporal data includes observations from many locations and different times, so the GWR method was developed into geographically and temporally weighted regression (GTWR), which considers both location and time aspects. However, the GTWR model has limitations because spatial distance does not affect time distance, so it is refined into improved geographically and temporally weighted regression (I-GTWR) by adding interaction weighting to the spatial-temporal distance function to improve model representation.
Parameter estimators in the I-GTWR method use the least squares method (MKT), which is sensitive to the presence of outliers. Outliers often contain valuable information that should not be eliminated, but their impact on the model should be minimized to make the parameter estimates more stable and accurate. This study examines the performance of the I-GTWR model on data containing outliers so that the resulting model is more robust to the impact of outliers. The robust estimation methods used to reduce the impact of outliers are the S-estimator, M-estimator, and Multi-Stage Method (MM-estimator).
Comparisons were made on simulated data with specific scenarios designed considering the position and percentage of outliers, as well as how the outliers were resolved using the I-GTWR and I-GTWR robust method with the S-estimator, M- estimator, and MM-estimator. Each scenario was repeated 100 times, resulting in 100 measures of model goodness of fit for each scenario. The scenarios are designed to evaluate how effective the addition of the robustness estimator method is in improving model performance, especially in the context of reducing the negative impact of outliers on the prediction results.
The simulation study results show that adding the S-estimator, M-estimator, and MM-estimator to the I-GTWR method results in a better model when compared to the standard I-GTWR model. Adding the three rugosity estimation methods does not show any significant difference, so using any of the three is sufficient to improve model performance. The position factor and the percentage of outliers affect the model performance. The bridle I-GTWR model effectively deals with outliers, mainly when the outliers are regularly distributed at the top or bottom positions. However, for the outlier percentage factor applied to all methods, both
bridged and standard, no specific conclusion can be drawn regarding when the model accuracy increases or decreases.
The addition of the S-estimator, M-estimator, and MM-estimator is applied to the empirical study to ensure the best model is used to effectively handle outliers in the regencies/cities GRDP data in West Java Province for the 2018-2022 period by considering spatial-temporal aspects. The robust I-GTWR model with MM- estimator consistently shows the best performance by providing a better accuracy evaluation value than the I-GTWR model with other robust estimation methods, making it the most optimal choice for modeling GRDP in West Java Province in the 2018-2022 period. Estimating GRDP parameters with influencing variables shows diverse results in each region and at each time. Overall, the empirical study shows that the variables of ROR (X1), GAF (X2), and FI (X3) are consistently the main factors affecting GRDP in West Java districts/cities during 2018-2022, while the poverty factor (X6) is only significant in 2019. Economic development in West Java Province shows a transformation from reliance on local income and foreign investment in 2018 to a more diverse and complex financial structure in 2022.