Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/137282
Title: Kajian Kinerja Multiple Long Short-Term Memory untuk Analisis Data Deret Waktu Takstasioner
Other Titles: Performance Assessment of Multiple Long Short-Term Memory for Non-Stationary Time Series Data Analysis
Authors: Sadik, Kusman
Notodiputro, Khairil Anwar
Khikmah, Khusnia Nurul
Issue Date: 2024
Publisher: IPB University
Abstract: Berkembangnya issue dan penelitian dalam analisis statistika membuat berkembangnya pendekatan dalam analisisnya. Salah satu metode yang terdepan dalam membantu pengambilan keputusan dan perencanaan ini yaitu peramalan dengan menggunakan deep learning. Pendekatan ini memiliki banyak perkembangan pendekatan, yaitu long short-term memory (LSTM) dan multiple long short-term memory (M-LSTM). Mempertimbangkan bahwa metode LSTM mampu mengenali pola data dan mampu memprediksi data deret waktu dengan baik, memiliki akurasi dan hasil peramalan yang lebih baik. Oleh karena itu, penelitian ini dilakukan dengan tujuan untuk mengkaji keunggulan metode LSTM berdasarkan data bangkitan. Selain itu, juga bertujuan untuk mendapatkan perbandingan kinerja metode LSTM dan M-LSTM dan penerapannya pada data empiris. Penelitian ini membangkitkan data dengan dua skenario yang berbeda, yaitu data simulasi yang dibangkitkan dari model FAR(1) dengan e(k)~N(0.5,1) dan data yang dibangkitkan dari FAR(1) kemudian dari data yang dibangkitkan diambil 10% secara acak dan diberikan noise e(k)~N(0.5,10) yang ditambahkan ke data awal sehingga membentuk data baru, yaitu FAR^* (1). Data yang dibangkitkan juga memiliki skenario jumlah periode waktu, yaitu 30, 350, 400, dan 450, dimana setiap kombinasi model dan periode waktu yang dibangkitkan dilakukan pengulangan sebanyak 100 ulangan. Data bangkitan ini selanjutnya dimodelkan dengan menggunakan metode LSTM dengan tujuan untuk mengidentifikasi perubahan kinerja metode LSTM ketika digunakan untuk memodelkan data dengan noise dan data dengan tambahan noise. Sedangkan kajian pada data empiris yang dilakukan pada penelitian ini adalah data persentase kemiskinan di tingkat kabupaten atau kota di Jawa. Data ini diambil dari website resmi Badan Pusat Statistik Indonesia (BPS), yaitu data dari tahun 2002 hingga 2022 atau sebanyak 21 data. Data empiris ini dilakukan pemodelan dengan menggunakan metode LSTM dan M-LSTM dengan tujuan untuk membandingkan keakuratan ramalan metode LSTM dan M-LSTM dalam meramalkan data tingkat kemiskinan kabupaten atau kota di Jawa Hasil analisis data simulasi menggunakan metode LSTM menunjukkan bahwa kinerja teknik ini lebih baik jika digunakan untuk memodelkan data yang diberi tambahan noise. Hal ini ditunjukkan oleh nilai MAPE yang kecil untuk data yang diberikan tambahan noise dibandingkan untuk data yang tidak diberi tambahan noise. Selanjutnya dari hasil analisis ragam tampak bahwa adanya perbedaan keakuratan ramalan, sehingga LSTM lebih baik jika digunakan untuk meramalkan data yang diberikan tambahan noise. Hasil analisis ragam juga menunjukkan bahwa interaksi semua faktor berpengaruh nyata. Akibatnya kita tidak dapat menyimpulkan secara umum apakah faktor jumlah observasi, jumlan neuoron atau epoch berpengaruh nyata terhadap RMSE. Pengaruh suatu faktor harus dievaluasi pada setiap level dari dua faktor lainnya. Pengujian lebih lanjut (lazim disebut multiple comparison) menggunakan uji t menunjukkan bahwa bahwa terdapat perbedaan yang signifikan pada rata-rata MAPE dari kedua data. Hasil perbandingan kinerja metode LSTM dan M-LSTM pada data empiris dilakukan praprosesan data dengan melakukan imputasi data hilang dan pengujian kestasioneran data. Hasil analisis yang diperoleh menunjukkan bahwa metode M-LSTM memiliki kinerja yang lebih baik dibandingkan LSTM dalam meramalkan data persentase kemiskinan di tingkat kabupaten atau kota di Jawa. Selanjutnya dilakukan analisis ragam, dimana hasil analisis menunjukkan signifikansi antara rata-rata MAPE. Oleh karena itu, dapat disimpulkan bahwa metode M-LSTM dengan jumlah neuron 16 cocok digunakan untuk meramalkan data persentase kemiskinan di tingkat kabupaten atau kota di Jawa.
The development of issues and research in statistical analysis has led to the development of approaches in analysis. One of the leading methods in assisting decision-making and planning is forecasting using deep learning. This approach has many developments, namely long short-term memory (LSTM) and multiple long short-term memory (M-LSTM). Considering that the LSTM method is able to recognize data patterns and predict time series data well, it has better forecasting accuracy and results. Therefore, this study was conducted with the aim of examining the advantages of the LSTM method based on the generation of data. In addition, it also aims to obtain a comparison of the performance of the LSTM and M-LSTM methods and their application to empirical data. This study generates data with two different scenarios, namely simulation data generated from the FAR(1) model with e(k)~N(0.5,1) and data generated from FAR(1) then from the generated data taken 10% randomly and given noise e(k)~N(0.5,10) which is added to the initial data to form new data, namely FAR^*(1). The generated data also has a scenario of the number of periods, namely 30, 350, 400, and 450, where each combination of models and periods generated is repeated 100 times. This generated data is then modeled using the LSTM method with the aim of identifying changes in the performance of the LSTM method when used to model data with noise and data with additional noise. Meanwhile, the study of empirical data conducted in this research is data on the percentage of poverty at the district or city level in Java. This data is taken from the official website of the Indonesian Central Bureau of Statistics (BPS), namely data from 2002 to 2022 or as much as 21 data. This empirical data is modeled using the LSTM and M-LSTM methods with the aim of comparing the forecast accuracy of the LSTM and M-LSTM methods in forecasting district or city poverty rate data in Java. The results of the simulation data analysis using the LSTM method show that this technique performs better when used to model data with added noise. This is shown by the smaller MAPE value for data with added noise than for data without added noise. Furthermore, from the results of the analysis of variance, it appears that there is a difference in the accuracy of the forecast, so LSTM is better if used to forecast data given additional noise. The results of the analysis of variance also show that the interaction of all factors has a significant effect. As a result, we cannot conclude whether the number of observations, number of neurons, or epochs has a significant effect on RMSE. The effect of a factor must be evaluated at each level of the other two factors. Further testing (commonly called multiple comparisons) using the t-test shows that there is a significant difference in the average MAPE of the two data. The results of comparing the performance of the LSTM and M-LSTM methods on empirical data were preprocessed by imputing missing data and testing data stationarity. The results obtained from the analysis show that the M-LSTM method has better performance than LSTM in forecasting poverty percentage data at the district or city level in Java. Furthermore, an analysis of variance is conducted, where the results of the analysis show the significance between the average MAPE. Therefore, it can be concluded that the M-LSTM method with 16 neurons is suitable for forecasting poverty percentage data at the district or city level in Java.
URI: http://repository.ipb.ac.id/handle/123456789/137282
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File Description SizeFormat 
Cover Khusnia N K.pdf
  Restricted Access
Cover555.97 kBAdobe PDFView/Open
Lampiran Khusnia N K.pdf
  Restricted Access
Lampiran360.47 kBAdobe PDFView/Open
G1501211049_Khusnia Nurul Khikmah.pdf
  Restricted Access
Fullteks2.64 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.