Teknik Pemodelan Statistical Downscaling Melalui Pengelompokan K-means dan EM.
View/ Open
Date
2018Author
Pitri, Rizka
Soleh, Agus Mohamad
Djuraidah, Anik
Metadata
Show full item recordAbstract
General circulation model (GCM) merupakan model numerik yang menghasilkan sejumlah data dari berbagai parameter iklim seperti curah hujan, temperatur, dan kelembaban untuk keperluan pendugaan iklim. Data luaran GCM yang berskala global dan memiliki resolusi yang kasar belum dapat mempertimbangkan kawasan yang berskala lokal dengan resolusi lebih tinggi daripada luaran GCM. Data GCM dapat digunakan untuk menduga curah hujan berskala lokal dengan menggunakan teknik statistical downscaling (SD).
SD merupakan suatu teknik yang digunakan untuk menggambarkan hubungan antara data pada grid berskala global (peubah bebas) dengan data pada grid berskala lokal (peubah takbebas). Pemodelan SD menggunakan luaran GCM melibatkan banyak data peubah yang tidak bebas (korelasi tinggi). Pada penelitian ini digunakan analisis komponen utama dan regresi kuadrat terkecil parsial untuk mengatasi permasalahan korelasi tinggi yang terjadi pada peubah bebas data luaran GCM. Selain itu, data curah hujan lokal dan data luaran GCM memiliki keragaman yang besar sehingga perlu dilakukan pengelompokan untuk memperkecil keragaman yang terjadi. Oleh karena itu, pada penelitian ini digunakan pengelompokan K-means dan EM sebagai pengelompokan awal sebelum dilakukan pemodelan RKU dan RKTP sehingga akan ada beberapa kelompok terbentuk dan dimodelkan berdasarkan kelompok yang terbentuk.
Penelitian ini juga dilakukan tahap simulasi dengan menggunakan dua ketentuan peubah bebas. Ketentuan tersebut, yaitu 36 peubah kovariat yang diambil memiliki kedekatan daerah satu sama lain dan 36 peubah kovariat diambil secara acak tanpa pengembalian. Sedangkan untuk peubah takbebas diambil sebanyak 84 contoh dari curah hujan lokal di wilayah Stasiun Klimatologi Bogor dengan pengembalian. Simulasi dilakukan untuk melihat kekonsistenan hasil pengelompokan optimum yang terbentuk menggunakan algoritma K-means dan EM. Kekonsistenan hasil pengelompokan optimum ditentukan berdasarkan nilai silhouette yang dihasilkan algoritma K-means dan EM.
Penelitian ini bertujuan untuk menentukan pengelompokan terbaik antara K-means dan EM serta metode statistical downscaling terbaik antara RKU dan RKTP untuk curah hujan bulanan pada empat stasiun curah hujan di Provinsi Jawa Barat. Peubah takbebas yang digunakan pada penelitian ini adalah data curah hujan bulanan empat stasiun curah hujan di Provinsi Jawa Barat dan peubah bebas (skala global) adalah data climate forecast system reanalysis v.2 (CFSRv2). Data CFSRv2 yang diambil terletak pada dan ( ) dengan ukuran domain grid. Setiap grid berukuran sehingga peubah bebas yang digunakan sebanyak 36 kovariat. Periode waktu yang digunakan untuk data curah hujan bulanan wilayah lokal dan data CFSRv2, yaitu Januari 2011 sampai dengan Desember 2017. Data peubah bebas dan takbebas dikelompokkan terlebih dahulu menggunakan pengelompokan K-means dan Expectation-maximization (EM), sebelum dilakukan pemodelan RKU dan RKTP pada setiap stasiun curah hujan.
Nilai RMSEP yang dihasilkan model RKU lebih kecil dibandingkan model RKTP. Wilayah Stasiun Geofisika Bandung memiliki nilai RMSEP curah hujan yang lebih kecil jika dibandingkan dengan stasiun lainnya, yaitu 86.32 dengan menggunakan pengelompokan K-means dan 78.09 dengan menggunakan pengelompokan EM. Jika dilihat dari pengelompokannya, secara umum pengelompokan EM menghasilkan nilai RMSEP yang lebih kecil dibandingkan dengan pengelompokan K-means.
Selain dari nilai RMSEP yang kecil, kebaikan model ditentukan dari nilai korelasi yang tinggi. Model RKU dan pengelompokan EM menghasilkan nilai korelasi yang tinggi, yaitu mendekati satu. Nilai korelasi tertinggi, yaitu 0.98 untuk wilayah Stasiun Meteorologi Citeko dengan nilai dugaan curah hujan yang diperoleh menggunakan model RKU dan pengelompokan EM. Grafik pola pergerakan nilai curah hujan aktual dan nilai dugaan curah hujan dari model RKU memiliki pola pergerakan yang sama dan memiliki jarak yang berdekatan, sehingga nilai dugaan curah hujan yang diperoleh model RKU relatif mendekati nilai curah hujan aktual di setiap stasiun curah hujan. Sehingga dapat disimpulkan bahwa, model RKU dengan menggunakan pengelompokan EM menghasilkan nilai RMSEP yang kecil dan korelasi yang tinggi untuk curah hujan disetiap stasiun curah hujan yang digunakan dalam penelitian ini dibandingkan dengan model RKTP dengan pengelompokan K-means.
Simulasi menunjukkan bahwa sebaran nilai silhouette dari algoritma K-means memiliki sebaran yang lebih pendek dibandingkan dengan sebaran nilai silhouette dari algoritma EM. Nilai silhouette yang diperoleh menggunakan algoritma EM memiliki nilai yang beragam dibandingkan nilai silhouette dari algoritma K-means dan terdapat salah satu nilai silhouette dari algoritma EM yang bernilai negative, yaitu -0.02. Selain itu, letak kedekatan data luaran GCM yang digunakan sangat mempengaruhi nilai silhouette yang dihasilkan. Letak data luaran GCM yang berdekatan satu sama lain menghasilkan nilai silhouette yang mendekati 1, artinya anggota di setiap kelompok memiliki tingkat kemiripan yang tinggi sedangkan letak data luaran GCM yang tidak saling berdekatan dan acak menghasilkan nilai silhouette yang mendekati -1, artinya anggota di setiap kelompok memiliki tingkat kemiripan yang rendah.
Pada penelitian ini nilai RMSEP dan korelasi yang dihasilkan model RKU dengan menggunakan pengelompokan K-means dan EM tidak berbeda secara signifikan. Pengelompokan yang lebih baik digunakan untuk penelitian selanjutnya adalah K-means.