Kinerja Metode Double Random Forest dan Long Short-Term Memory untuk Analisis Indikator Ekonomi
Date
2023Author
Ratnasari, Andika Putri
Susetyo, Budi
Notodiputro, Khairil Anwar
Metadata
Show full item recordAbstract
Metode pembelajaran mesin dapat digunakan sebagai metode alternatif untuk
menganalisis data deret waktu. Metode berbasis pohon termasuk ke dalam
supervised learning. Double Random Forest (DRF) merupakan metode berbasis
pohon yang dikembangkan pada tahun 2020. Metode ini merupakan pengembangan
dari Random Forest (RF). Menurut pengembangnya, keunggulan DRF adalah
mampu meningkatkan kinerja dari RF saat RF mengalami underfitting. Selain
metode berbasis pohon, metode jaringan syaraf juga dapat digunakan untuk
menganalisis data deret waktu. Long Short-Term Memory (LSTM) merupakan
metode jaringan syaraf yang memiliki kemampuan untuk menganalisis data tidak
linier dan menyimpan informasi dalam jangka waktu yang panjang. Perbandingkan
kinerja metode DRF dan LSTM belum pernah diteliti sebelumnya. Oleh karena itu,
penelitian ini bertujuan untuk membandingkan kinerja metode DRF dan LSTM
menggunakan data simulasi. Selain menggunakan data simulasi, penelitian ini juga
membandingkan kinerja dari DRF dan LSTM pada data empiris.
Data simulasi dalam penelitian ini dibangkitkan dengan empat skenario yang
berbeda yaitu data simulasi deret waktu linier dan tidak linier yang underfitting dan
tidak underfitting. Data simulasi deret waktu linier underfitting dan tidak
underfitting dibangkitkan dari model Autoregressive Integrated Moving Average
(ARIMA). Adapun model ARIMA yang digunakan adalah ARIMA (1,1,1),
ARIMA (2,1,2), dan ARIMA (3,1,3). Jumlah periode waktu yang dibangkitkan
adalah 120 dan 360 periode waktu. Pada setiap kombinasi model dan periode waktu
dilakukan pembangkitan data sebanyak 20 ulangan, sehingga pada seluruh
kombinasi model dan periode waktu dapat diperoleh masing-masing 120 data
simulasi linier underfitting dan tidak underfitting. Pembangkitan data simulasi tidak
linier underfitting dan tidak underfitting dilakukan menggunakan model deret
waktu tidak linier yaitu Self-Exciting Threshold Auto Regressive (2,1,1).
Pembentukan data yang underfitting dan tidak underfitting tersebut dilakukan
berdasarkan hasil trial dan error.
Penelitian ini juga menerapkan metode DRF dan LSTM pada data empiris.
Data empiris yang digunakan adalah data indikator ekonomi bulanan dari bulan
Januari 2010 sampai Desember 2022. Data indikator ekonomi yang digunakan
dalam penelitian ini adalah nilai tukar rupiah, cadangan devisa, impor, ekspor, dan
M1 (jumlah uang beredar). Kelima indikator ekonomi ini dipilih karena memiliki
karakteristik yang berbeda-beda yaitu linier dan tidak linier yang underfitting dan
tidak underfitting. Karakteristik dari kelima indikator diidentifikasi melalui analisis
Random Forest dan Uji Terasvirta. Peubah respon yang digunakan dalam penelitian
ini adalah data pada waktu ke-t, sedangkan peubah prediktornya adalah data pada
waktu ke-t-1.
Hasil studi simulasi pada data linier underfitting dan tidak underfitting secara
eksploratif berdasarkan boxplot menunjukkan bahwa metode LSTM memiliki
sebaran nilai RMSE, MAE, dan MAPE yang lebih kecil dibandingkan dengan DRF.
Selanjutnya, berdasarkan hasil analisis sidik ragam menunjukkan terdapat perbedaan nilai keakuratan ramalan yang dihasilkan kedua model tergantung pada
karakteristik data simulasi. Saat dilakukan pengujian menggunakan uji t
berpasangan diperoleh kesimpulan bahwa terdapat perbedaan rata-rata nilai RMSE,
MAE, dan MAPE yang signifikan pada DRF dan LSTM. Dengan demikian, dapat
disimpulkan bahwa pada data simulasi linier underfitting dan tidak underfitting
metode LSTM memiliki kinerja yang lebih baik dibandingkan dengan DRF.
Perbandingan kinerja metode DRF dan LSTM pada data simulasi tidak linier
underfitting secara eksploratif menggunakan boxplot menunjukkan bahwa sebaran
nilai RMSE, MAE, dan MAPE metode DRF lebih kecil dibandingkan dengan
LSTM. Pada data simulasi tidak linier tidak underfitting, diperoleh hasil bahwa
metode DRF dan LSTM memiliki sebaran nilai RMSE, MAE, dan MAPE yang
hampir sama. Analisis sidik ragam juga dilakukan pada data simulasi tidak linier
underfitting dan tidak underfitting berdasarkan ketiga ukuran keakuratan ramalan.
Hasil analisis sidik ragam menunjukkan bahwa terdapat perbedaan nilai keakuratan
ramalan yang dihasilkan kedua model tergantung pada karakteristik data simulasi.
Selanjutnya, dilakukan pengujian menggunakan uji t berpasangan, kesimpulan
yang diperoleh yaitu terdapat perbedaan rata-rata nilai RMSE, MAE, dan MAPE
yang signifikan dari metode DRF dan LSTM pada data simulasi tidak linier
underfitting. Kesimpulan dari uji t berpasangan pada data simulasi tidak linier tidak
underfitting adalah tidak terdapat perbedaan rata-rata nilai RMSE, MAE, dan
MAPE yang signifikan dari metode DRF dan LSTM. Oleh karena itu, dapat
disimpulkan bahwa metode DRF memiliki kinerja yang lebih baik dibandingkan
dengan LSTM pada data simulasi tidak linier underfitting, sedangkan pada data
simulasi tidak linier tidak underfitting metode DRF memiliki kinerja yang tidak
berbeda signifikan dengan LSTM.
Perbandingan kinerja metode DRF dan LSTM pada data empiris dilakukan
setelah dilakukan identifikasi karakteristik data menggunakan Random Forest dan
Uji Terasvirta. Hasil pemeriksaan karakteristik data menunjukkan bahwa Nilai
tukar rupiah memiliki karakteristik tidak linier tidak underfitting. Cadangan devisa
memiliki karakteristik linier tidak underfitting. Impor memiliki karakteristik tidak
linier underfitting. Ekspor memiliki karakteristik tidak linier tidak underfitting. M1
memiliki karakteristik linier underfitting. Hasil analisis data empiris menggunakan
metode DRF dan LSTM menunjukkan bahwa metode LSTM memiliki kinerja lebih
baik dibandingkan dengan DRF pada data M1, cadangan devisa, dan ekspor.
Sebaliknya, pada data impor dan nilai tukar rupiah metode DRF memiliki kinerja
yang lebih baik dibandingkan dengan LSTM. Pemilihan metode dengan kinerja
terbaik didasarkan pada nilai RMSE, MAE, dan MAPE terkecil. Metode dengan
kinerja terbaik digunakan untuk meramalkan setiap indikator ekonomi.