SARIMA dan Bagging Exponential Smoothing untuk Peramalan Produksi Cabai Merah Nasional
Abstract
Data deret waktu adalah kumpulan data yang diorganisir berdasarkan urutan waktu pengamatannya, dengan pengambilan data yang dilakukan secara berkala dalam interval yang tetap. Analisis deret waktu digunakan untuk mengidentifikasi tren serta pola yang muncul dalam data, termasuk pola musiman yang ditandai dengan fluktuasi teratur dalam periode tertentu. Dengan menerapkan analisis ini, pola dalam data dapat dikenali sehingga memungkinkan pembuatan model peramalan yang memprediksi nilai di masa depan berdasarkan data sebelumnya. Salah satu metode yang umum digunakan untuk peramalan adalah ARIMA (Autoregressive Integrated Moving Average), yang efektif dalam menganalisis data stasioner dengan rataan dan ragam yang stabil. Untuk data dengan pola musiman, digunakan pengembangan dari ARIMA yang disebut SARIMA (Seasonal ARIMA). Meskipun metode ini sering diterapkan, akurasi hasil prediksi masih dapat ditingkatkan dengan teknik tambahan seperti ensemble machine learning, yang mengombinasikan beberapa model untuk meningkatkan ketepatan peramalan.
Salah satu teknik dalam ensemble learning adalah bootstrap aggregating (bagging), yang digunakan untuk mengurangi variabilitas dalam model peramalan. Bagging dalam analisis deret waktu diterapkan dengan melatih beberapa model pada subset data yang berbeda guna meningkatkan akurasi prediksi. Salah satu pendekatan yang memanfaatkan teknik ini adalah Bagging Exponential Smoothing (BES), yang mengombinasikan berbagai model exponential smoothing dengan parameter berbeda seperti alpha, beta, gamma, dan theta. Sebelum menerapkan BES, dilakukan dekomposisi data deret waktu untuk memisahkan komponen tren, musiman, dan sisaan. Untuk data dengan pola musiman yang kuat, metode Seasonal-Trend decomposition using Loess (STL) digunakan karena mampu menghilangkan noise dan memperjelas pola musiman serta tren. Selain itu, Robust STL (RSTL) dikembangkan untuk menangani keberadaan outlier dalam data, menjadikannya metode yang lebih andal dalam menganalisis data deret waktu dengan pola musiman yang rentan terhadap outlier.
Penelitian ini berfokus untuk melakukan peramalan produksi cabai merah dengan mempertimbangkan faktor musimannya. Tujuan dari penelitian ini adalah membandingkan metode analisis deret waktu dengan model SARIMA, Bagging Exponential Smoothing dengan Dekomposisi STL Tidak Kekar (BES-STL) dan Bagging Exponential Smoothing dengan Dekomposisi STL Kekar (BES-RSTL) serta melakukan peramalan produksi cabai merah dengan metode terbaik.
Penelitian ini menggunakan data sekunder berupa produksi cabai merah yang bersumber dari Badan Pusat Statistik dan Kementerian Pertanian. Data tersebut berformat bulanan pada tingkat nasional, mencakup periode dari Januari 2013 hingga Desember 2021, dengan total 108 titik amatan. Untuk keperluan analisis, data dibagi menjadi dua bagian data training dan data testing. Data training, yang meliputi periode Januari 2013 hingga Desember 2019, digunakan untuk membangun model tentatif, sedangkan data testing, yang mencakup periode Januari 2020 hingga Desember 2021, digunakan untuk memvalidasi model. Selain itu, guna mengevaluasi keakuratan peramalan, digunakan data tambahan dari Januari hingga Desember 2022 untuk membandingkan hasil prediksi dengan data aktual.
Implementasi model SARIMA, BES-STL dan BES-RSTL menunjukkan bahwa model SARIMA memberikan kinerja peramalan yang lebih baik dibandingkan kedua model lainnya, dengan nilai MAPE sebesar 7,46%. Angka ini lebih rendah dibandingkan dengan model BES-STL dan BES-RSTL, yang masing-masing memiliki MAPE sebesar 10,69% dan 10,49%. Indikasi ini mengisyaratkan bahwa model SARIMA lebih akurat dalam memprediksi produksi cabai merah nasional dibandingkan model BES-STL dan BES-RSTL. Peramalan untuk periode Januari hingga Desember 2022 menggunakan model SARIMA(1,0,0)(2,1,0)12 menunjukkan hasil yang cukup mendekati data aktual, terutama pada periode Januari hingga September 2022, dengan rata-rata selisih antara hasil peramalan dan produksi aktual sebesar 51.273 kuintal. Namun, mulai Oktober hingga Desember 2022, produksi aktual mengalami lonjakan signifikan, mengakibatkan selisih rata-rata sebesar 232.373 kuintal, yang mengindikasikan bahwa model SARIMA kurang optimal untuk peramalan jangka panjang.
Selain itu, hasil penelitian juga mengungkap bahwa penggunaan metode yang lebih kompleks tidak selalu menghasilkan akurasi yang lebih baik dibandingkan metode yang lebih sederhana. Penelitian ini menggunakan data produksi cabai merah yang terdiri dari 108 titik amatan dengan pola musiman yang kuat, jelas, dan teratur. Oleh karena itu, model SARIMA lebih unggul karena secara khusus dirancang untuk mengidentifikasi pola musiman dan tren secara eksplisit. Sebaliknya, model berbasis machine learning seperti bagging memerlukan jumlah data yang lebih besar agar dapat mengenali pola secara efektif. Jika data yang tersedia terbatas, model ensemble cenderung kurang optimal dalam mempelajari pola musiman atau tren dibandingkan dengan SARIMA.
Pemodelan SARIMA memperlihatkan hasil yang lebih akurat dibandingkan BES-STL dan BES-RSTL, dengan selisih MAPE masing-masing sebesar 3,23 poin dan 3,03 poin. Sementara itu, perbedaan MAPE antara BES-STL dan BES-RSTL terbilang sangat kecil, yakni hanya sebesar 0,2 poin.