Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/131539
Title: Perbandingan Performa Model Regresi, XGBoost, dan RNN pada Data Deret Waktu (Studi Kasus Kemiskinan di Tingkat Kabupaten/Kota)
Other Titles: Comparison of The Performance of Regression Model, XGBoost, and RNN on Time Series Data (Case Study of Poverty at The District/City Level)
Authors: Sadik, Kusman
Angraini, Yenni
Setianingsih, Nanda Fitria
Issue Date: 2023
Publisher: IPB University
Abstract: Analisis data deret waktu telah banyak digunakan di berbagai bidang dan umumnya menggunakan satu peubah atau dikenal dengan analisis univariat. Kelemahan analisis ini adalah tidak dapat melihat pengaruh dari peubah lain. Permasalahan tersebut dapat diatasi menggunakan analisis multivariat. Kemiskinan merupakan permasalahan ekonomi yang dipengaruhi oleh beberapa faktor sehingga dapat menggunakan analisis multivariat. Penelitian ini bertujuan membandingkan performa model regresi, XGBoost, dan Recurrent Neural Network pada data tingkat kemiskinan di Kabupaten Purbalingga, Kabupaten Kudus, dan Kota Jakarta Barat. Data yang digunakan adalah tingkat kemiskinan, PDRB, upah minimum kabupaten/kota, rata-rata lama sekolah, tingkat pengangguran terbuka, tingkat partisipasi angkatan kerja, dan usia harapan hidup tahun 2010–2020. Hasil penelitian ini diperoleh bahwa model regresi masih baik dalam memprediksi tingkat kemiskinan pada data deret waktu tanpa pencilan. Namun, model regresi kurang cocok untuk data deret waktu yang memiliki pencilan. Metode yang lebih cocok digunakan pada data deret waktu dengan pencilan adalah metode machine learning. Metode machine learning juga lebih konsisten dalam menentukan peubah yang berkontribusi dalam prediksi. Peubah penting yang berkontribusi dalam memprediksi kemiskinan di tingkat kabupaten/kota yang dianalisis adalah PDRB.
Time series data analysis has been widely used in various fields and is commonly known as univariate analysis, as it typically involves a single variable. The weakness of this analysis is its inability to account for the influence of other variables. This issue can be addressed through multivariate analysis. Poverty is an economic problem influenced by several factors, making it suitable for multivariate analysis. This research aims to compare the performance of Regression Model, XGBoost, and Recurrent Neural Network on poverty levels data in Purbalingga Regency, Kudus Regency, and West Jakarta City. The data used includes poverty levels, GRDP, district/city minimum wage, average years of schooling, open unemployment rate, labor force participation rate, and life expectancy from 2010 to 2020. The results of this research indicate that the regression model is still effective in predicting poverty levels in time series data without outliers. However, regression model is less suitable for time series data that contains outliers. A method more suitable for time series data with outliers is machine learning. Machine learning methods are also more consistent in identifying variables contributing to predictions. An important variable contributing to poverty prediction at the district/city level in the analyzed data is GRDP.
URI: http://repository.ipb.ac.id/handle/123456789/131539
Appears in Collections:UT - Statistics and Data Sciences

Files in This Item:
File Description SizeFormat 
Cover, Lembar Pernyataan, Abstrak, Lembar Pengesahan, Prakata dan Daftar Isi.pdf
  Restricted Access
Cover525.12 kBAdobe PDFView/Open
G14190024_Nanda Fitria Setianingsih.pdf
  Restricted Access
Fullteks1.89 MBAdobe PDFView/Open
Lampiran.pdf
  Restricted Access
Lampiran128.91 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.