UT - Statistics and Data Sciences

UT - Statistics and Data Sciences http://repository.ipb.ac.id/handle/123456789/162418 Sun, 26 Apr 2026 08:17:38 GMT 2026-04-26T08:17:38Z Identifikasi Faktor Penting dalam Klasifikasi Pengalaman Kerawanan Pangan di Pulau Papua dengan Ensemble Variable Importance Berbasis Algoritma Genetika http://repository.ipb.ac.id/handle/123456789/172974 Identifikasi Faktor Penting dalam Klasifikasi Pengalaman Kerawanan Pangan di Pulau Papua dengan Ensemble Variable Importance Berbasis Algoritma Genetika Riyanto, Indra Mahib Zuhair Variable importance (VI) merupakan aspek penting dalam model machine learning (ML). Namun, algoritma ML yang berbeda sering kali menghasilkan peringkat VI yang berbeda, sehingga menyulitkan interpretasi. Penelitian ini mengkaji permasalahan tersebut dalam kasus klasifikasi kerawanan pangan di wilayah rentan Pulau Papua, di mana tingginya angka kemiskinan dan keterbatasan akses layanan dasar memerlukan intervensi yang tepat sasaran. Penelitian ini menggunakan data Survei Sosial Ekonomi Nasional Maret 2024 yang mencakup 11.016 rumah tangga. Penelitian ini melatih empat model ML, yaitu Random Forest, XGBoost, Multilayer Perceptron, dan Regresi Logistik, dengan strategi penanganan ketidakseimbangan kelas untuk mengklasifikasikan status kerawanan pangan berdasarkan Food Insecurity Experience Scale. Algoritma Genetika akan digunakan untuk menyusun ensemble variable importance (EVI) dengan memaksimalkan rata-rata terboboti dari korelasi Spearman setiap model ML dengan peringkat EVI. Pendekatan EVI berhasil mengintegrasikan berbagai VI model ML dengan rata-rata terboboti korelasi Spearman sebesar 0.912. Lima faktor utama yang teridentifikasi adalah provinsi, persentase pengeluaran rumah tangga untuk makan, proporsi kepemilikan tabungan dalam rumah tangga, status kelayakan bahan lantai, dan luas lantai bangunan per jiwa. Dominasi peubah provinsi mendorong analisis lebih lanjut dengan pendekatan clustering, yang mengungkapkan bahwa relevansi faktor ekonomi bervariasi antar wilayah. Hasil penelitian ini menunjukkan kemampuan EVI dalam menghasilkan suatu peringkat kepentingan peubah yang representatif ketika terdapat variasi VI antarmetode ML. Hasil EVI yang didapat juga menunjukkan perlunya strategi intervensi berbasis wilayah guna mengatasi kerawanan pangan di wilayah rentan Pulau Papua. Thu, 01 Jan 2026 00:00:00 GMT http://repository.ipb.ac.id/handle/123456789/172974 2026-01-01T00:00:00Z Pendeteksian Anomali Data Jumlah Wisatawan Mancanegara di Indonesia dengan Metode Copula-Based Outlier Detection http://repository.ipb.ac.id/handle/123456789/172969 Pendeteksian Anomali Data Jumlah Wisatawan Mancanegara di Indonesia dengan Metode Copula-Based Outlier Detection Prayoga, Nabil Bintang Anomali adalah pengamatan yang menyimpang dari pola historis dan dapat muncul dari hubungan ketergantungan antarpeubah. Copula-based outlier detection (COPOD) mengakomodasi beberapa peubah menggunakan distribusi marginal empiris dan struktur ketergantungan ekor untuk mengidentifikasi anomali. Penelitian ini bertujuan mendeteksi anomali data jumlah wisatawan mancanegara di Indonesia dengan mempertimbangkan peubah inflasi dan nilai tukar rupiah serta mengevaluasi penanganan anomali terhadap performa peramalan long short-term memory (LSTM). Data bulanan dari Januari 2000 hingga Desember 2025 yang diperoleh dari CEIC Data, Badan Pusat Statistik, dan Bank Indonesia digunakan dalam penelitian. Analisis mencakup eksplorasi data dan pembentukan feature engineering berdasarkan struktur data serta identifikasi lag, pendeteksian anomali menggunakan COPOD, dilanjutkan peramalan LSTM. Pendeteksian dilakukan berdasarkan dua belas peubah hasil feature engineering dan teridentifikasi sebelas periode sebagai anomali. Hasil peramalan menunjukkan akurasi lebih baik pada model sesudah penanganan dengan mean absolute percentage error, root mean square error, dan korelasi sebesar 7,494%, 99233, dan 0,864 pada data uji. Keefektifan tersebut tidak dapat dipisahkan dari ketepatan pendeteksian anomali. Penelitian lanjutan diharapkan dapat menambah peubah relevan dan mengembangkan feature engineering.; Anomalies are observations that deviate from historical patterns and can arise from dependencies between variables. Copula-based outlier detection (COPOD) accommodates multiple variables using empirical marginal distributions and tail dependence structures to identify anomalies. This study aims to detect anomalies in the number of international tourists in Indonesia by considering the variables of inflation and the rupiah exchange rate, as well as to evaluate the handling of anomalies on the forecasting performance of long short-term memory (LSTM). Monthly data from January 2000 to December 2025 obtained from CEIC Data, Statistics Indonesia, and Bank Indonesia were used in the study. The analysis includes data exploration and the development of feature engineering based on the data structure and lag identification, anomaly detection using COPOD, followed by LSTM forecasting. Detection was carried out based on twelve variables resulting from feature engineering, and eleven periods were identified as anomalies. The forecasting results show better accuracy in the model after handling with a mean absolute percentage error, root mean square error, and correlation of 7.494%, 99233, and 0.864 on the test data. This effectiveness cannot be separated from the accuracy of anomaly detection. Further research is expected to add relevant variables and develop feature engineering. Thu, 01 Jan 2026 00:00:00 GMT http://repository.ipb.ac.id/handle/123456789/172969 2026-01-01T00:00:00Z Implementasi Model IndoBERT Untuk Menangani Ketidakseimbangan Data Dalam Analisis Sentimen Ulasan Aplikasi KAI Access http://repository.ipb.ac.id/handle/123456789/172929 Implementasi Model IndoBERT Untuk Menangani Ketidakseimbangan Data Dalam Analisis Sentimen Ulasan Aplikasi KAI Access Listyowati, Dyah Analisis sentimen adalah proses pengolahan data tekstual untuk meneliti pendapat atau opini mengenai entitas tertentu. Analisis sentimen dapat diterapkan dalam berbagai hal, salah satunya pada aplikasi KAI Access. Penelitian ini menggunakan 4359 data ulasan aplikasi KAI Access dari bulan Juni 2025-Agustus 2025 yang diklasifikasikan ke kelas positif, negatif dan netral. Penelitian akan mengimplementasikan IndoBERT, salah satu model Bidirectional Encoder Representation from Transformers (BERT) monolingual dengan penerapan Synthetic Minority Over-sampling Technique dan Random Oversampling sebagai metode penanganan yang sering digunakan untuk menangani data tak seimbang. Tujuan dari penelitian ini adalah mengimplementasikan metode untuk penanganan data tak seimbang dan membandingkan model untuk menangani ketidakseimbangan sentimen ulasan pengguna pada aplikasi KAI Access. Data akan dibagi menjadi tiga yaitu 80% data latih, 10% data validasi dan 10% data uji. Penelitian ini menggunakan tiga skenario yaitu IndoBERT, IndoBERT dengan SMOTE, dan IndoBERT dengan ROS. Dari ketiga skenario tersebut, akurasi yang dihasilkan oleh model IndoBERT tanpa penanganan memiliki hasil yang terbaik namun evaluasi mendalam menunjukan bahwa model dengan SMOTE memiliki performa yang baik untuk kelas minor pada kasus data tak seimbang. Thu, 01 Jan 2026 00:00:00 GMT http://repository.ipb.ac.id/handle/123456789/172929 2026-01-01T00:00:00Z Perbandingan SARIMA Intervensi dan Prophet dalam Peramalan Jumlah Penumpang Kereta Api di Jawa http://repository.ipb.ac.id/handle/123456789/172829 Perbandingan SARIMA Intervensi dan Prophet dalam Peramalan Jumlah Penumpang Kereta Api di Jawa FAJRIALDY, PRATAMA Pulau Jawa memiliki tingkat kepadatan penduduk yang tinggi sehingga mobilitas antar wilayah berlangsung cukup tinggi. Kondisi ini menjadikan kereta api sebagai salah satu moda transportasi yang banyak digunakan dan memerlukan perencanaan operasional yang memadai. Data jumlah penumpang kereta api berbentuk deret waktu musiman dengan pola tahunan yang relatif konsisten. Namun, terjadinya pandemi COVID-19 menyebabkan perubahan pola yang cukup signifikan sehingga memunculkan gangguan struktural pada data. Berdasarkan karakteristik data yang bersifat musiman dan adanya intervensi, penelitian ini menerapkan metode SARIMA Intervensi dan Prophet. Oleh karena itu, penelitian ini bertujuan untuk membandingkan kinerja SARIMA Intervensi dan Prophet dalam meramalkan jumlah penumpang kereta api di Pulau Jawa. Data yang digunakan merupakan data bulanan dengan periode 2006–2024. Model terbaik dari masing-masing metode selanjutnya dievaluasi dan dibandingkan menggunakan Mean Absolute Percentage Error (MAPE) dan Root Mean Square Error (RMSE). Hasil penelitian menunjukkan model SARIMA Intervensi menghasilkan nilai MAPE sebesar 14,31% dan RMSE sebesar 4.924,97, sedangkan model Prophet memberikan hasil yang lebih baik dengan MAPE sebesar 6.49% dan RMSE sebesar 2.486.12. Perbandingan ini menunjukkan bahwa Prophet lebih unggul dalam meramalkan jumlah penumpang kereta api di Pulau Jawa sehingga Prophet diharapkan dapat dipertimbangkan sebagai metode alternatif dalam perencanaan transportasi darat di Pulau Jawa melalui pendekatan peramalan.; Java Island has a high population density so that mobility between regions quite high. This condition makes trains a widely used mode of transportation and requires adequate operational planning. The number of train passengers data is seasonal time series with a relatively consistent annual pattern. However, COVID19 pandemic caused quite significant changes in patterns, giving structural disturbances in the data. Based on seasonal data and the interventions, this research applies SARIMA Intervention and Prophet methods. Therefore, this study aims to compare the performance of SARIMA Intervention and Prophet in predicting the number of train passengers on Java Island. The data monthly form for the period 2006–2024. The best model from each method then were evaluated and compared using Mean Absolute Percentage Error (MAPE) and Root Mean Square Error (RMSE). The research results showed that SARIMA Intervention model produced a MAPE 14.31% and RMSE 4,924.97, while the Prophet model provided better results with a MAPE 6.49% and RMSE 2,486.12. This comparison showed that Prophet is superior in predicting the number of train passengers on Java Island, so it is hoped that Prophet can be considered as an alternative method in planning land transportation on Java Island through a forecasting approach. Thu, 01 Jan 2026 00:00:00 GMT http://repository.ipb.ac.id/handle/123456789/172829 2026-01-01T00:00:00Z