Model Pembelajaran Mesin Data Deret Waktu dengan Peubah Eksogen Sentimen Berita untuk Peramalan Pertumbuhan Ekonomi Indonesia
Abstract
Peramalan deret waktu merupakan komponen penting dalam analisis ekonomi dan telah digunakan secara luas untuk memprediksi berbagai indikator ekonomi makro. Sejak diperkenalkan oleh Box dan Jenkins pada tahun 1976, integrasi model Autoregressive (AR) dan Moving Average (MA) dalam metode Autoregressive Integrated Moving Average (ARIMA) menjadi salah satu model yang paling populer dalam analisis deret waktu karena kemampuannya menangani data yang tidak stasioner. Seiring berkembangnya teknologi dan komputasi menjadi semakin murah, model-model berbasis pembelajaran mesin seperti Recurrent Neural Network (RNN) dan variannya, Long Short-Term Memory (LSTM) serta Gated Recurrent Unit (GRU) menjadi alternatif solusi dalam analisis deret waktu.
Berbagai penelitian menunjukkan bahwa peramalan dengan model berbasis RNN khususnya LSTM dan GRU memberikan hasil yang lebih baik. Dalam peramalan indikator ekonomi dan keuangan, penelitian empiris menunjukkan bahwa LSTM dan GRU mampu mengungguli model tradisional seperti ARIMA. Selain itu, model stacked RNN, yang mengombinasikan beberapa lapisan reccurent baik RNN, LSTM atau GRU, juga telah terbukti menghasilkan kinerja peramalan yang lebih baik, khususnya dalam bidang ekonomi. Penggunaan peubah eksogen seperti data sentimen berita juga terbukti dalam banyak kajian mampu meningkatkan akurasi peramalan. Model ARIMA with Exogenous Variables (ARIMAX) merupakan salah satu pendekatan yang menggabungkan peubah eksogen yang dianggap memiliki pengaruh signifikan terhadap data, terbukti mampu meningkatkan kinerja peramalan pada berbagai studi. Tidak hanya pada model ARIMA, penggunaan peubah eksogen juga dapat diterapkan pada model-model seperti RNN, LSTM dan GRU.
Selain penggunaan peubah eksogen, teknik optimasi parameter juga memainkan peran penting dalam meningkatkan kinerja model peramalan. Hyperparameter tuning adalah proses pencarian kombinasi parameter yang paling optimal sehingga model dapat menghasilkan prediksi dengan akurasi yang lebih tinggi. Optimasi Bayes merupakan salah satu teknik yang unggul dalam pendugaan parameter model. Metode ini memanfaatkan kaidah Bayes dalam menduga nilai-nilai parameter yang diuji, sehingga memungkinkan penggunaan sumber daya yang lebih efektif dalam pencarian konfigurasi optimal. Dengan pendekatan probabilistik, optimasi Bayes dapat meminimalkan jumlah evaluasi yang diperlukan untuk menemukan pengaturan parameter terbaik, sehingga sangat cocok diterapkan pada model-model kompleks seperti model berbasis RNN.
Dalam konteks ekonomi Indonesia, pertumbuhan ekonomi diukur berdasarkan nilai Produk Domestik Bruto (PDB) dan dirilis secara kuartalan oleh Badan Pusat Statistik (BPS). Namun, adanya jeda waktu dalam perilisannya memunculkan kebutuhan untuk melakukan perkiraan awal kondisi ekonomi yang lebih cepat. Penelitian yang memanfaatkan analisis sentimen untuk peramalan di Indonesia masih terbatas, dan tantangan utama adalah minimnya ketersediaan leksikon berbahasa Indonesia untuk bidang ekonomi. Untuk mengatasi masalah ini, beberapa penelitian menggunakan pendekatan translasi bahasa atau membangun model leksikon khusus.
Penelitian ini membandingkan kinerja enam arsitektur model yang berbeda mencakup ARIMA, ARIMAX, RNN, LSTM, GRU, dan stacked RNN-GRU serta stacked RNN-LSTM. Hasil analisis menunjukkan bahwa penambahan peubah sentimen berita secara signifikan meningkatkan kinerja model dalam meramalkan pertumbuhan ekonomi. Seluruh model dengan peubah eksogen secara konsisten menghasilkan RMSE yang lebih rendah dibandingkan dengan model tanpa peubah eksogen. Sebagai contoh, model stacked RNN-GRU dengan peubah skor sentimen unggul dengan RMSE rata-rata sebesar 0,1431 persen, jauh lebih baik dibandingkan model stacked RNN-GRU tanpa skor sentimen dengan RMSE sebesar 0,2397 persen. Di antara semua model yang diuji, model stacked RNN-GRU menunjukkan kinerja terbaik dengan RMSE terendah, diikuti oleh model stacked RNN-LSTM. Model-model ini menunjukkan kemampuan yang lebih baik dalam menangkap fluktuasi ekonomi yang kompleks dan memberikan prediksi yang lebih akurat. Model stacked RNN-GRU juga mampu memberikan prediksi yang lebih stabil di mana simpangan baku RMSE sebesar 0,0042 persen yang lebih rendah dibandingkan model lainnya.
Penelitian ini juga melakukan pencarian hyperparameter yang optimal untuk model berbasis RNN menggunakan teknik optimasi Bayes. Optimasi Bayes memungkinkan pencarian kombinasi hyperparameter yang menghasilkan kinerja model terbaik dengan meminimalkan RMSE. Proses pencarian ini dilakukan dengan menggunakan Gaussian Process sebagai fungsi pengganti dan Expected Improvement sebagai fungsi akuisisi. Hasil optimasi menunjukkan bahwa pengaturan hiperparameter yang optimal semakin meningkatkan kinerja model, terutama pada model stacked RNN-GRU dengan nilai RMSE sebesar 0,1329 persen.
Kesimpulan dari penelitian ini menunjukkan bahwa penggunaan analisis sentimen berita sebagai peubah eksogen dalam model peramalan pertumbuhan ekonomi Indonesia terbukti efektif dalam meningkatkan akurasi prediksi. Model stacked RNN-GRU muncul sebagai model terbaik dengan kinerja yang superior baik pada data latih maupun data uji. Hasil ini memberikan bukti empiris bahwa integrasi variabel eksogen, khususnya sentimen berita, dapat memberikan nilai tambah yang signifikan dalam peramalan ekonomi. Penelitian ini tidak hanya menjawab tujuan utama yang telah ditetapkan, tetapi juga membuka peluang untuk penelitian lebih lanjut dalam pemanfaatan data teks dan analisis sentimen untuk peramalan ekonomi di Indonesia. Penggunaan model berbasis RNN dengan integrasi peubah eksogen dapat menjadi alat yang berharga bagi pembuat kebijakan dan praktisi ekonomi dalam menghadapi dinamika ekonomi yang kompleks dan cepat berubah.