Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/168587
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorDjuraidah, Anik
dc.contributor.advisorNotodiputro, Khairil Anwar
dc.contributor.authorSativa, Oryza
dc.date.accessioned2025-08-11T03:22:38Z
dc.date.available2025-08-11T03:22:38Z
dc.date.issued2025
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/168587
dc.description.abstractMetode ensemble merupakan gabungan beberapa model prediksi yang digunakan untuk menghasilkan hasil prediksi yang lebih akurat, stabil, dan informatif dibandingkan dengan model tunggal. Dalam pemodelan iklim, metode ini mampu mengintegrasikan berbagai sumber ketidakpastian dan memberikan gambaran yang lebih realistis mengenai kemungkinan hasil. Beberapa teknik ensemble yang umum digunakan antara lain Averaging, Stacking Random Forest, dan Bayesian Model Averaging (BMA) yang masing-masing memiliki keunggulan tersendiri. Averaging merata-ratakan prediksi model dasar sehingga dapat mengurangi keragaman prediksi, Stacking Random Forest menggabungkan kekuatan dari metode meta-learning dengan algoritma Random Forest yang efektif dalam menangani data nonlinier dan berdimensi tinggi, sedangkan BMA memberikan bobot berdasarkan peluang posterior untuk mempertimbangkan ketidakpastian model. Dalam konteks prediksi curah hujan, keluaran Global Climate Model (GCM) generasi terbaru seperti Coupled Model Intercomparison Project Phase 6 (CMIP6) banyak digunakan sebagai sumber data skenario iklim masa depan. Salah satu skenario dari CMIP6 adalah Decadal Climate Prediction Project (DCPP), yang menghasilkan simulasi prediksi iklim jangka menengah (10 tahun ke depan) dengan kondisi awal yang dikendalikan. Namun, data GCM perlu dikonversi menjadi informasi iklim resolusi tinggi yang sesuai untuk skala lokal melalui pendekatan Statistical Downscaling (SDS). Pemodelan curah hujan menghadapi tantangan, antara lain sebaran data yang tidak normal, hubungan nonlinier, serta keragaman yang tinggi antar waktu dan lokasi. Pendekatan sebaran Gamma sesuai digunakan karena mampu merepresentasikan karakteristik curah hujan yang bersifat kontinu, positif, dan menjulur ke kanan. Selain itu, banyaknya peubah prediktor GCM dapat menyebabkan overfitting dan multikolinieritas, sehingga diperlukan metode regularisasi. Elastic Net merupakan pendekatan yang efektif karena mengombinasikan penalti regresi LASSO dan Ridge untuk seleksi peubah pada data dengan korelasi tinggi. Penelitian ini memanfaatkan pendekatan Statistical Downscaling dengan regresi Gamma dan Elastic Net untuk prediksi curah hujan. Selanjutnya, hasil prediksi dari masing-masing model GCM digabungkan menggunakan tiga metode ensemble, yaitu Averaging, Stacking Random Forest, dan BMA. Kinerja model ensemble kemudian dibandingkan dengan model tunggal untuk mengevaluasi tingkat akurasi dalam memodelkan curah hujan di wilayah studi. Lokasi pada penelitian ini adalah Jawa Barat yang diwakili oleh enam stasiun curah hujan yang tersebar di Jawa Barat dari tiga kategori dataran, yaitu Stasiun Cibukamanah, Stasiun Krangkeng, Stasiun Kawali, Stasiun Katulampa, Stasiun Cibeureum, dan Stasiun Gunung Mas. Data yang digunakan adalah data bulanan dari Januari 1991 hingga Desember 2020 yang terdiri atas tiga jenis data, yaitu data dari sebelas DCPP sebagai peubah penjelas, data CHIRPS sebagai pengkoreksi dan data curah hujan observasi sebagai peubah respon. Evaluasi model dilakukan menggunakan Rood Mean Square Error of Prediction (RMSEP) dan korelasi. Hasil penelitian menunjukkan bahwa DCPP CNRM-ESM2-1 adalah DCPP terbaik dalam memprediksi curah hujan dari sebelas DCPP yang digunakan yang memiliki rata-rata nilai RMSEP 114,75 dan rata-rata nilai korelasi 0,75. Sementara itu, metode Stacking Random Forest menjadi metode terbaik dalam memprediksi curah hujan pada kasus ini yaitu dengan rata-rata nilai RMSEP 102,17 dan rata-rata nilai korelasi 0,77. Hal ini menunjukkan penggunaan metode ensemble mampu menurunkan nilai RMSEP dan meningkatkan nilai korelasi dibandingkan dengan model tunggal dalam memprediksi curah hujan di Jawa Barat. Penelitian ini belum sepenuhnya mampu menangkap kejadian curah hujan ekstrem yang terdapat pada data observasi. Oleh kerena itu, disarankan untuk menggunakan pendekatan statistika yang lebih adaptif terhadap karakteristik sebaran ekstrem. Selain itu, penelitian ini memiliki keterkaitan yang erat dengan tujuan pembangunan berkelanjutan atau Sustainable Development Goals (SDGs), khususnya tujuan 13 yaitu Penanganan Perubahan Iklim (climate action). Kata Kunci: climate action, curah hujan, ensemble, gamma-elastic net, statistical downscaling
dc.description.abstractThe ensemble method is a combination of several predictive models used to produce predictions that are more accurate, stable, and informative compared to a single model. In climate modeling, this method is capable of integrating various sources of uncertainty and providing a more realistic depiction of possible outcomes. Several commonly used ensemble techniques include Averaging, Stacking Random Forest, and Bayesian Model Averaging (BMA), each of which has its own advantages. Averaging works by averaging the predictions of base models to reduce prediction variability, Stacking Random Forest combines the strengths of meta-learning methods with the Random Forest algorithm, which is reliable in handling high-dimensional and nonlinear data, while BMA assigns weights based on posterior probabilities to account for model uncertainty. In the context of rainfall prediction, outputs from the latest generations of Global Climate Models (GCM), such as the Coupled Model Intercomparison Project Phase 6 (CMIP6), are widely used as data sources for future climate scenarios. One of the scenarios from CMIP6 is the Decadal Climate Prediction Project (DCPP), which produces medium-term climate prediction simulations (for the next 10 years) with controlled initial conditions. However, GCM data need to be converted into high-resolution climate information suitable for local scales through a Statistical Downscaling (SDS) approach. Rainfall modeling faces several challenges, including nonnormal data distribution, nonlinear relationships, and high variability across time and locations. The Gamma distribution approach is appropriate because it can represent the characteristics of rainfall data that are continuous, positive, and right-skewed. In addition, the large number of predictor variables from GCM outputs can lead to overfitting and multicollinearity, thereby requiring a regularization method. Elastic Net is an effective approach because it combines LASSO and Ridge regression penalties for variable selection in highly correlated data. This study applied a Statistical Downscaling approach using Gamma regression and Elastic Net to predict rainfall. Subsequently, the prediction results from each GCM model were combined using three ensemble methods: Averaging, Stacking Random Forest, and BMA. The performance of the ensemble models was then compared with single models to evaluate the level of prediction accuracy in the study area. The research was conducted in West Java Province, represented by six rainfall stations distributed across three elevation categories, namely Cibukamanah Station, Krangkeng Station, Kawali Station, Katulampa Station, Cibeureum Station, and Gunung Mas Station. The data used consisted of monthly observations from January 1991 to December 2020, comprising three types of data: outputs from eleven DCPP models as explanatory variables, CHIRPS data as correction data, and observed rainfall data as the response variable. Model evaluation was performed using the Root Mean Square Error of Prediction (RMSEP) and correlation. The results of this study indicate that DCPP CNRM-ESM2-1 is the best-performing scenario among the eleven DCPP models used, achieving an average RMSEP of 114,75 and an average correlation of 0,75 in predicting rainfall. In terms of modeling approach, the Stacking Random Forest method outperformed other techniques, with an average RMSEP of 102,17 and an average correlation of 0,77. These findings demonstrate that ensemble methods can improve predictive accuracy by lowering RMSEP values and increasing correlation coefficients compared to single-model approaches, particularly in rainfall prediction over West Java. This study has not yet fully captured the occurrence of extreme rainfall events present in the observational data. Therefore, it is recommended to apply statistical approaches that are more adaptive to the characteristics of extreme distributions in future research. In addition, this research is closely related to the objectives of the Sustainable Development Goals (SDGs), particularly Goal 13: Climate Action, as it contributes to efforts in understanding and addressing the impacts of climate change through improved rainfall prediction. Keywords: climate action, ensemble, gamma-elastic net, rainfall, statistical downscaling
dc.description.sponsorship
dc.language.isoid
dc.publisherIPB Universityid
dc.titleStatistical Downscaling dengan Regresi Gamma-Elastic Net menggunakan Metode Ensemble untuk Prediksi Curah Hujan di Jawa Baratid
dc.title.alternativeA Statistical Downscaling with Gamma-Elastic Net Regression using Ensemble Methods for Predicting Rainfall in West Java
dc.typeTesis
dc.subject.keywordcurah hujanid
dc.subject.keywordensembleid
dc.subject.keywordStatistical Downscalingid
dc.subject.keywordclimate actionid
dc.subject.keywordgamma-elastic netid
Appears in Collections:MT - School of Data Science, Mathematic and Informatics

Files in This Item:
File Description SizeFormat 
cover_G1501211035_fcdfeb9a253c45a5aafea17e694795b1.pdfCover2.91 MBAdobe PDFView/Open
fulltext_G1501211035_978dc0c9ad7a4be9bbdfa8d33167bee7.pdf
  Restricted Access
Fulltext7.23 MBAdobe PDFView/Open
lampiran_G1501211035_fd7fb1bd6ac74c5a998729d12e27adc9.pdf
  Restricted Access
Lampiran7.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.