Metode Ensemble pada Pemodelan Statistical Downscaling Menggunakan Tweedie Compound Poisson Gamma LASSO dengan Koreksi Bias
Date
2024Author
Dewanti, Dhea
Djuraidah, Anik
Sartono, Bagus
Sopaheluwakan, Ardhasena
Metadata
Show full item recordAbstract
Model regresi Tweedie Compound Poisson Gamma (TCPG) adalah model statistika dengan peubah respon bersebaran TCPG yang mengasumsikan bahwa terjadinya suatu peristiwa mengikuti sebaran Poisson dan intensitas setiap peristiwa mengikuti sebaran Gamma. Curah hujan merupakan salah satu contoh data bersebaran TCPG karena memiliki komponen diskret (kejadian hujan) dan komponen kontinu (intensitas curah hujan). Penelitian mengenai curah hujan sudah banyak dilakukan dan umumnya menggunakan dua model dan sebaran yang berbeda untuk komponen diskret dan kontinu sehingga perlu dilakukan secara simultan untuk meningkatkan hasil prediksi pemodelan curah hujan di masa yang akan datang.
Statistical Downscaling (SD) dapat digunakan untuk memprediksi curah hujan lokal berdasarkan data Global Circulation Model (GCM). Decadal Climate Prediction Project (DCPP) yang merupakan salah satu GCM berasal dari grid-grid berdekatan dan saling berkorelasi sehingga tidak memenuhi syarat bebas multikolinieritas jika dijadikan peubah penjelas untuk memprediksi curah hujan. DCPP yang juga merupakan data simulasi numerik dari berbagai lembaga iklim dunia memiliki bias terhadap data observasi dan kemampuan prediksi yang beragam sehingga perlu dilakukan pengkoreksian terlebih dahulu dan dikombinasikan dengan teknik ensemble untuk mengurangi kesalahan prediksi dari masing-masing model.
Pada penelitian ini, akan dilakukan SD pada empat luaran GCM CMIP6 menggunakan model TCPG-LASSO dengan terlebih dahulu melakukan koreksi bias pada data luaran GCM terhadap data Climate Hazards Group Infrared Precipitation with Stations (CHIRPS) menggunakan metode Empirical Quantil Mapping (EQM). Hasil prediksi curah hujan dari setiap model luaran GCM selanjutnya akan dilakukan proses ensemble stacking dengan random forest sebagai meta-model. Adapun tujuan dari penelitian ini adalah untuk melakukan koreksi bias pada data curah hujan GCM dan membandingkan kinerja model Statistical Downscaling Tweedie Compound Poisson Gamma LASSO (TCPG-LASSO) ensemble dengan dan tanpa koreksi bias serta model tunggal dari setiap GCM.
Lokasi yang menjadi objek penelitian adalah Jawa Barat yang diwakili oleh enam stasiun curah hujan, yaitu Stasiun Cibukamanah, Stasiun Krangkeng, Stasiun Kawali, Stasiun Katulampa, Stasiun Cibeureum dan Stasiun Gunung Mas. Data yang digunakan merupakan data bulanan dari Januari 1991 hingga Desember 2020 yang terdiri dari tiga jenis data, yaitu empat data DCPP (CNRM-ESM2, IPSL-CM6A-LR, MIROC6, MPI-ESM1-2-LR) sebagai peubah penjelas, data CHIRPS sebagai pengkoreksi dan data curah hujan observasi sebagai peubah respon. Adapun evaluasi model akan dilakukan menggunakan Root Mean Square Error Prediction (RMSEP) dan koefisien korelasi.
Hasil penelitian menunjukkan bahwa koreksi bias berhasil meningkatkan kinerja model dalam memprediksi curah hujan baik secara keseluruhan maupun berdasarkan jenis dataran jika dilihat berdasarkan model tunggal. Sementara itu, untuk ensemble Stacking-RF, koreksi bias tidak meningkatkan kinerja model baik secara keseluruhan maupun berdasarkan jenis dataran. Perbandingan juga dilakukan untuk melihat kinerja model tunggal dan model ensemble dalam memprediksi curah hujan. Hasil perbandingan baik untuk model sebelum maupun setelah koreksi bias menunjukkan bahwa model ensemble memiliki kinerja yang lebih baik daripada model tunggal karena memiliki RMSEP lebih kecil dan korelasi lebih besar. Kombinasi penggunaan koreksi bias dan model ensemble ini dapat dijadikan rekomendasi saat melakukan SD untuk meningkatkan kemampuan prediksi curah hujan di stasiun dan daerah lainnya. The Tweedie Compound Poisson Gamma (TCPG) regression model is statistical model with a TCPG distribution response variable, which assumes that the occurrence of an event follows a Poisson distribution and the intensity of each event follows a Gamma distribution. Rainfall is an example of TCPG-distributed data because it has a discrete component (rainfall events) and a continuous component (rainfall intensity). Much research on rainfall has been carried out. Generally, it uses two different models and distributions for the discrete and continuous components. Hence, it needs to be carried out simultaneously to improve the results of rainfall modelling predictions in the future.
Statistical Downscaling (SD) can be used to predict local rainfall based on Global Circulation Model (GCM) data. The Decadal Climate Prediction Project (DCPP), which is one of the GCMs, originates from adjacent grids and is correlated with each other so that it does not meet the multicollinearity-free requirements if used as an explanatory variable to predict rainfall. DCPP, which is also numerical simulation data from various world climate institutions, has a bias towards observational data and varying prediction capabilities, so it needs to be corrected first and combined with ensemble techniques to reduce prediction errors from each model.
In this research, SD will be carried out on four CMIP6 GCM outputs using the TCPG-LASSO model by first carrying out bias correction on the GCM output data on Climate Hazards Group Infrared Precipitation with Stations (CHIRPS) data using the Empirical Quantile Mapping (EQM) method. The rainfall prediction results from each GCM output model will then be carried out by an ensemble stacking process with random forest as the meta-model. This research aims to carry out bias correction on GCM rainfall data and compare the performance of the Statistical Downscaling Tweedie Compound Poisson Gamma LASSO (TCPG-LASSO) ensemble model with and without bias correction as well as a single model for each GCM output.
The location of the object of research is West Java, which is represented by six rainfall stations, namely Cibukamanah Station, Krangkeng Station, Kawali Station, Katulampa Station, Cibeureum Station and Gunung Mas Station. The data used is monthly data from January 1991 to December 2020, which consists of three types of data, namely four DCPP data (CNRM-ESM2, IPSL-CM6A-LR, MIROC6, MPI-ESM1-2-LR) as explanatory variables, CHIRPS data as correction and observational rainfall data as response variable. The model evaluation will be carried out using Root Mean Square Error Prediction (RMSEP) and correlation coefficient.
The research results show that bias correction succeeded in improving the model's performance in predicting rainfall both overall and based on terrain type when viewed based on a single model. Meanwhile, for the Stacking-RF ensemble, bias correction does not improve model performance either overall or based on terrain type. Comparisons were also made to see the performance of single models and ensemble models in predicting rainfall. Comparison results for both the model before and after bias correction show that the ensemble model has better performance than the single model because it has a smaller RMSEP and larger correlation. The combination of bias correction and ensemble modelling can be recommended when conducting statistical downscaling to enhance the prediction capability of rainfall at stations and other areas.