Statistical Downscaling Dua Tahap dengan Multi-Class Random Forest dan Regresi Kuadrat Terkecil Parsial untuk Memprediksi Curah Hujan
View/ Open
Date
2019Author
Hadiana, Riana
Soleh, Agus Mohamad
Sartono, Bagus
Metadata
Show full item recordAbstract
Indonesia merupakan negara agraris di mana sekitar 29% penduduk Indonesia
bekerja di sektor pertanian, yang memiliki ketergantungan yang tinggi terhadap
curah hujan. Informasi tentang curah hujan sering digunakan untuk menentukan
waktu tanam dan jenis tanaman yang sesuai di suatu daerah, sehingga hasil
pertanian yang diperoleh bisa optimal. Oleh karena itu, informasi tentang curah
hujan sangat penting bagi sektor pertanian.
Pemodelan untuk memprediksi curah hujan telah banyak dilakukan dengan
memanfaatkan data luaran Global Climate Model (GCM). Data yang disediakan
oleh GCM adalah data hasil pemodelan parameter iklim pada skala global yang
berorientasi spasial dan temporal. Data luaran GCM dapat digunakan untuk
menduga parameter iklim pada skala lokal menggunakan teknik downscaling. Salah
satu teknik downscaling yang dapat digunakan adalah statistical downscaling (SD).
SD menggunakan model statistika untuk menghubungkan parameter-parameter
iklim global (luaran GCM) dengan parameter-parameter iklim lokal yang diperoleh
dari stasiun pengamatan klimatologi.
Studi literatur menunjukkan bahwa teknik SD satu tahap belum cukup baik
untuk menduga curah hujan ekstrim. Penambahan kelompok curah hujan pada
model sebagai peubah boneka memberikan hasil prediksi curah hujan yang lebih
baik dibandingkan dengan tidak ada penambahan kelompok curah hujan.
Penambahan peubah boneka kelompok curah hujan pada model berdasarkan data
curah hujan lokal bulanan tidak dapat diaplikasikan untuk meprediksi curah hujan
yang akan datang karena informasi kelompok curah hujan tidak tersedia.
Pemodelan dua tahap dengan melakukan pemodelan klasifikasi kelompok curah
hujan terlebih dahulu diduga akan meningkatkan presisi prediksi curah hujan.
Penelusuran pustaka tentang SD dua tahap menyimpulkan bahwa Teknik SD
dua tahap memberikan hasil prediksi curah hujan yang lebih baik dibandingkan
dengan SD satu tahap. Semakin baik hasil pemodelan klasifikasi kelompok curah
hujan yang didapatkan, maka hasil prediksi curah hujan yang didapatkan akan
semakin baik juga. Oleh karena itu, prediksi curah hujan pada penelitian ini
menggunakan pemodelan SD dua tahap dengan algoritme Random Forest (RF)
untuk memprediksi kelompok curah hujan yang dikelompokkan ke dalam tiga
kelompok. Regresi Kuadrat Terkecil Parsial (RKTP) digunakan untuk memprediksi
curah hujan setelah informasi mengenai kelompok curah hujan diketahui.
Data yang digunakan dalam penelitian ini adalah data curah hujan lokal
harian dari tahun 2011 hingga 2018 yang disediakan oleh Badan Meteorologi dan
Klimatologi Geofisika (BMKG) di pos pengamatan hujan Bogor, Citeko, Jatiwangi,
Bandung, Serang, Syarif Kasim II, Mempawah, dan Pattimura sebagai peubah
respons. Peubah prediktor yang digunakan adalah laju presipitasi harian dari data
luaran GCM, Climate Forecast System (CFS) versi 2 dengan ukuran grid sebesar
0.5o × 0.5o dan luas wilayah pengamatan sebesar 6 × 6 grid di setiap lokasi.
Pemodelan dalam penelitian ini dimulai dengan pemodelan SD satu tahap, di
mana hasil yang diperoleh akan dibandingkan dengan hasil pemodelan SD dua
tahap. Pemodelan SD satu tahap dengan pengelompokan terbukti bisa memperbaiki
hasil prediksi curah hujan yang dihasilkan oleh model SD satu tahap. Sebelum
melakukan pemodelan SD dua tahap, terlebih dahulu dilakukan pemilihan
algoritme RF. Penelitian ini menunjukkan bahwa tidak terdapat perbedaan akurasi
yang signifikan yang dihasilkan oleh RF, RF dengan pendekatan One Versus One,
dan RF dengan pendekatan One Versus All. Dengan demikian, RF digunakan
sebagai algoritme klasifikasi pada SD dua tahap dalam penelitian ini.
Semua pemodelan termasuk pemodelan SD dua tahap yang dilakukan pada
penelitian ini menggunakan validasi silang 5-lipat dengan 20 kali ulangan. Model
terbaik di setiap pos pengamatan dipilih dari 99 model SD dua tahap pada data
harian dan 4851 model SD dua tahap pada data bulanan menggunakan kriteria
RMSEP (Root Mean Squares of Error Prediction) dan KK (Koefisien Keragaman).
Nilai akurasi pada pemodelan klasifikasi data curah hujan harian masih berkisar di
antara 62% hingga 77% sehingga pemodelan SD dua tahap pada data curah hujan
harian menghasilkan nilai RMSEP yang tidak jauh berbeda dengan pemodelan satu
tahap dengan nilai Koefisien Keragaman lebih besar dari 100%. Nilai akurasi pada
pemodelan klasifikasi data curah hujan bulanan berkisar di antara 63% hingga 84%
dan secara umum lebih baik dari nilai akurasi pada pemodelan klasifikasi data curah
hujan harian, sehingga prediksi curah hujan bulanan menggunakan pemodelan SD
dua tahap lebih baik dibandingkan dengan pemodelan SD satu tahap dengan nilai
KK terletak di antara 35% hingga 50%.