Title: Pemodelan Geographically Weighted Ridge dan Lasso Regression.
Other Titles: Geographically Weighted Ridge and Lasso Regression (Case Study: Data on Gross Regional Domestic Product in 56 Regencies/Cities on Kalimantan Island)
Authors: Aidi, Muhammad Nur
Fitrianto, Anwar
Wirwana, Dikky
Issue Date: 2023
Publisher: IPB University
Abstract: Produk Domestik Regional Bruto (PDRB) adalah nilai tambah produksi yang didapatkan dari berbagai sektor. Nilai PDRB adalah salah satu indikator untuk melihat dan mengukur pertumbuhan ekonomi suatu daerah. Pulau Kalimantan memiliki nilai PDRB yang cukup tertinggal jika dibandingkan dengan pulau lainnya. Oleh karena itu diperlukan analisis regresi untuk melihat faktor-faktor apa saja yang memengaruhi nilai PDRB. Namun, permasalahan yang sering ditemukan ialah kondisi lokasi setiap tempat berbeda. Ada banyak hal yang melatarbelakanginya salah satunya adalah dari segi geografis. Hal ini sering disebut dengan heterogenitas spasial. Salah satu pemodelan spasial yang mengatasi heterogenitas spasial adalah Geographically Weighted Regression (GWR). Model ini merupakan pengembangan dari regresi linear yang mana pada GWR nilai koefieisen regresi berlaku secara lokal. Model ini menghitung parameter regresi untuk setiap lokasi pengamatan akibatnya setiap lokasi pengamatan mempunyai nilai parameter regresi yang berbeda – beda. Untuk mengetahui faktor faktor yang mempengaruhi pada regresi digunakan model multiple regresi dimana menggunakan beberapa peubah bebas. Syarat peubah bebas pada multiple regresi harusnya saling bebas, namun pada kenyataannya tuntutan tersebut tidak terpenuhi atau dengan arti lain peubah bebas mengalami multikolinieritas. Ada beberapa metode yang mampu untuk mengatasi multikolinieritas pada model GWR diantaranya adalah GWR dengan Ridge (GWRR) dan Least Absolute Shrinkage and Selection Operator (LASSO) (GWLR). Penelitian ini bertujuan untuk memodelkan model GWR, GWRR dan GWLR dan menentukan faktor-faktor apa saja yang memengaruhi nilai PDRB pada Kabupaten/Kota di pulau Kalimantan pada tahun 2018. Hasil penelitian didapatkan model GWR membentuk dua kelompok peubah signifikan berdasarkan kabupaten/kota. Model GWRR membentuk tiga kelompok peubah signifikan berdasarkan kabupaten/kota. Model GWLR membentuk lima kelompok peubah signifikan berdasarkan kabupaten/kota. Berdasarkan ketiga model tersebut model GWLR lebih baik dibandingkan dengan model GWR dan GWRR dalam memodelkan data PDRB dengan nilai R2 99.88% dan RMSE 985.14.
Gross Regional Domestic Product (GRDP) is the added value of production obtained from various sectors. GRDP value is an indicator to see and measure the economic growth of a region. Kalimantan Island has a GRDP value that is quite lagging behind when compared to other islands. Therefore, a regression analysis is needed to see what factors influence the GRDP value. However, the problem that is often found is the location conditions of each place are different. There are many things behind it, one of which is in terms of geography. This is often referred to as spatial heterogeneity. One of the spatial modeling that overcomes spatial heterogeneity is Geographically Weighted Regression (GWR). This model is a development of linear regression in which the GWR value of the regression coefficient applies locally. This model calculates the regression parameters for each observation location, so that each observation location has different regression parameter values. To find out the factors that influence the regression, a multiple regression model is used which uses several independent variables. The terms of the independent variables in multiple regression should be independent, but in reality these demands are not met or in other words the independent variables have multicollinearity. There are several methods that are able to overcome multicollinearity in the GWR model, including GWR with Ridge (GWRR) and Least Absolute Shrinkage and Selection Operator (LASSO) (GWLR). This study aims to model the GWR, GWRR and GWLR models and determine what factors influence GRDP values in districts/cities on the island of Kalimantan in 2018. The research results show that the GWR model forms two groups of significant variables based on districts/cities. The GWRR model forms three groups of significant variables based on districts/cities. The GWLR model forms five groups of significant variables based on districts/cities. Based on these three models, the GWLR model is better than the GWR and GWRR models in modeling GRDP data with an R2 value of 99.88% and an RMSE of 985.14.
