| dc.contributor.advisor | Notodiputro, Khairil Anwar | |
| dc.contributor.advisor | Oktarina, Sachnaz Desta | |
| dc.contributor.author | IRDAYANTI | |
| dc.date.accessioned | 2026-01-21T10:33:05Z | |
| dc.date.available | 2026-01-21T10:33:05Z | |
| dc.date.issued | 2026 | |
| dc.identifier.uri | http://repository.ipb.ac.id/handle/123456789/172215 | |
| dc.description.abstract | Peramalan merupakan upaya memprediksi nilai di masa depan berdasarkan
pola historis data. Kemampuan menghasilkan prediksi yang akurat penting untuk
mengurangi ketidakpastian dan mendukung pengambilan keputusan. Kompleksitas
data modern menuntut metode yang semakin adaptif sehingga mendorong
pemanfaatan model deep learning untuk menghasilkan prediksi yang lebih andal.
Dalam konteks ini, Long Short-Term Memory (LSTM) dan Gated Recurrent Unit
(GRU) menjadi dua arsitektur yang paling banyak digunakan karena mampu
menangkap ketergantungan temporal dan pola nonlinear secara efektif. Berbagai
studi menunjukkan bahwa kedua metode ini memiliki kinerja yang baik dalam
memodelkan deret waktu yang kompleks. Namun, hasil yang diperoleh seringkali
berbeda tergantung pada karakteristik data. Perbedaan hasil ini mengindikasikan
bahwa tidak ada satu model yang selalu superior untuk semua jenis data sehingga
menarik untuk mengevaluasi bagaimana potensi penggabungan hasil prediksi
keduanya. Pendekatan ensemble dipandang berpotensi meningkatkan stabilitas dan
akurasi hasil prediksi dengan memanfaatkan kekuatan masing masing model
sekaligus mengurangi bias dari model tunggal. Penelitian ini menggunakan teknik
penggabungan hasil prediksi berbasis rataan, yaitu Bayesian Model Averaging
(BMA) serta Weighted Averaging (WA) untuk menghasilkan prediksi yang lebih
stabil, robust, dan akurat.
Penelitian ini bertujuan untuk mengevaluasi kinerja SARIMA, LSTM, GRU
serta menilai potensi penggabungan prediksi LSTM-GRU melalui pendekatan
BMA dan WA. Analisis dilakukan melalui dua pendekatan, yaitu kajian simulasi
dan kajian empiris. Pada kajian simulasi, data dibangkitkan menggunakan model
ARIMA(1,1,1)(1,0,1)12 dengan ???? yang mengikuti GARCH(1,1) serta tambahan
komponen interaksi lag (????-1 × ????-2). Empat skenario disusun berdasarkan
kombinasi tingkat volatilitas (tinggi dan rendah) serta keberadaan interaksi lag (ada
dan tanpa interaksi). Setiap skenario direplikasi sebanyak 50 kali sehingga total
diperoleh 200 dataset simulasi. Kajian empiris menggunakan data harga nikel
global frekuensi bulanan periode Januari 1990–Mei 2025 yang bersumber dari
World Bank – Pink Sheet. Model dengan kinerja terbaik selanjutnya digunakan
untuk meramalkan harga nikel 12 periode ke depan.
Evaluasi kinerja untuk data simulasi dan empiris dilakukan menggunakan dua
metrik utama, yaitu RMSE dan MAPE. Analisis nonparametrik faktorial (ANOVA
ART) digunakan untuk menilai pengaruh model, volatilitas, dan interaksi lag secara
simultan pada studi simulasi. Selain itu, pengujian signifikansi perbedaan kinerja
dilakukan menggunakan uji parametrik dan nonparametrik, yaitu paired t-test dan
wilcoxon signed-rank test untuk model yang berpasangan serta independent t-test
dan mann–whitney untuk perbandingan antar metode ensemble.
Hasil kajian simulasi menunjukkan bahwa SARIMA memiliki kinerja paling
rendah pada seluruh skenario, ditunjukkan oleh nilai RMSE dan MAPE yang relatif
tinggi. Kondisi ini menunjukkan keterbatasannya dalam menangkap pola deret
waktu yang kompleks. Sebaliknya, model deep learning LSTM dan GRU
menghasilkan kesalahan prediksi yang lebih rendah dan stabil dengan GRU sebagai
model tunggal paling unggul pada seluruh skenario simulasi. Pada kajian empiris,
pola yang sama kembali terlihat, di mana GRU memperoleh kinerja terbaik dengan
RMSE sebesar 0,077 dan MAPE 0,55%. Penggabungan prediksi LSTM dan GRU
melalui BMA dan WA menunjukkan kemampuannya mempertahankan tingkat
akurasi yang baik pada semua skenario simulasi dengan BMA memberikan kinerja
lebih baik. Meski demikian, hasil penggabungannya tidak memberikan peningkatan
akurasi yang signifikan dibandingkan GRU sebagai model tunggal. Pada analisis
empiris, BMA memberikan kesalahan prediksi terendah dengan RMSE 0,076 dan
MAPE 0,54%. Peramalan harga nikel untuk 12 periode mendatang (Juni 2025–Mei
2026) kemudian dilakukan menggunakan GRU dan BMA. Keduanya
memproyeksikan kecenderungan penurunan harga nikel dengan pergerakan yang
relatif stabil tanpa fluktuasi tajam, yang mengindikasikan potensi pelemahan harga
nikel di pasar global. | |
| dc.description.abstract | Time series forecasting is an effort to predict future values based on historical
patterns in the data. The ability to generate accurate forecasts is essential for
reducing uncertainty and supporting informed decision-making. The growing
complexity of modern data requires increasingly adaptive methods, encouraging the
use of deep learning models to produce more reliable predictions. In this context,
Long Short-Term Memory (LSTM) and Gated Recurrent Unit (GRU) have become
two of the most widely used architectures due to their ability to capture temporal
dependencies and nonlinear patterns effectively. Numerous studies have shown that
both methods perform well in modeling complex time series. However, their results
often vary depending on the characteristics of the data. Such variation indicates that
no single model is consistently superior across all conditions, highlighting the need
to assess the potential of combining their predictive outputs. Ensemble approaches
are considered promising for enhancing the stability and accuracy of predictions by
leveraging the strengths of each model while reducing the bias inherent in single
model approaches. This study employs averaging-based ensemble techniques,
namely Bayesian Model Averaging (BMA) and Weighted Averaging (WA), to
produce predictions that are more stable, robust, and accurate.
This study aims to evaluate the performance of SARIMA, LSTM, and GRU,
as well as to assess the potential of combining LSTM–GRU forecasts through BMA
and WA. The analysis is conducted using two approaches: a simulation study and
an empirical study. In the simulation study, data are generated using an
ARIMA(1,1,1)(1,0,1)12 model with ???? following GARCH(1,1) and additional lag
interaction component (????-1 × ????-2). Four scenarios are constructed based on
combinations of volatility levels (high and low) and the presence or absence of lag
interaction. Each scenario is replicated 50 times, resulting in a total of 200 simulated
datasets. The empirical study utilizes global nickel price data with monthly
frequency for the period January 1990–May 2025 obtained from the World Bank
Pink Sheet. The model with the best performance is subsequently used to forecast
nickel prices for the next 12 periods.
Performance evaluation for both the simulated and empirical data was carried
out using two main metrics, namely RMSE and MAPE. A factorial nonparametric
analysis (ANOVA ART) was employed to assess the simultaneous effects of model,
volatility, and lag interaction in the simulation study. In addition, the significance
of performance differences was examined using both parametric and nonparametric
tests: the paired t-test and Wilcoxon signed-rank test for paired models, as well as
the independent t-test and Mann–Whitney test for comparisons between ensemble
methods.
The simulation results show that SARIMA consistently exhibits the lowest
performance across all scenarios, as indicated by its relatively high RMSE and
MAPE values. This reflects its limitations in capturing complex time series patterns.
In contrast, the deep learning models LSTM and GRU yield lower and more stable
prediction errors, with GRU standing out as the best-performing single model in
every simulation scenario. A similar pattern is observed in the empirical analysis,
where GRU again achieves the strongest performance, with an RMSE of 0.077 and
a MAPE of 0.55%. The combination of LSTM and GRU predictions through BMA
and WA demonstrates the ability to maintain good levels of accuracy across all
simulation settings, with BMA consistently providing better performance than WA.
Nevertheless, the ensemble results do not offer a significant improvement over
GRU as an individual model. In the empirical analysis, BMA records the lowest
prediction error, with an RMSE of 0.076 and a MAPE of 0.54%. Forecasts for the
next 12 periods (June 2025–May 2026) were subsequently generated using GRU
and BMA, both of which project a downward trend in nickel prices with relatively
stable movements and no sharp fluctuations, indicating the potential weakening of
the global nickel market during the forecast horizon. | |
| dc.description.sponsorship | | |
| dc.language.iso | id | |
| dc.publisher | IPB University | id |
| dc.title | Bayesian Model Averaging dan Weighted Averaging Berbasis Model LSTM dan GRU untuk Peramalan Harga Nikel | id |
| dc.title.alternative | Bayesian Model Averaging and Weighted Averaging Based on LSTM and GRU Models for Forecasting Nickel Prices | |
| dc.type | Tesis | |
| dc.subject.keyword | deep learning | id |
| dc.subject.keyword | deret waktu | id |
| dc.subject.keyword | Ensemble forecasting | id |
| dc.subject.keyword | Harga nikel | id |
| dc.subject.keyword | peramalan | id |