<?xml version="1.0" encoding="UTF-8"?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
<title>UT - Statistics and Data Sciences</title>
<link href="http://repository.ipb.ac.id/handle/123456789/162418" rel="alternate"/>
<subtitle/>
<id>http://repository.ipb.ac.id/handle/123456789/162418</id>
<updated>2026-04-29T14:59:43Z</updated>
<dc:date>2026-04-29T14:59:43Z</dc:date>
<entry>
<title>Peramalan Interval Harga Cryptocurrency Ethereum Dengan LSTM yang Terintegrasi dengan Lower-Upper Bound Estimation</title>
<link href="http://repository.ipb.ac.id/handle/123456789/173001" rel="alternate"/>
<author>
<name>Nafiz, Muhammad</name>
</author>
<id>http://repository.ipb.ac.id/handle/123456789/173001</id>
<updated>2026-04-28T07:03:44Z</updated>
<published>2026-01-01T00:00:00Z</published>
<summary type="text">Peramalan Interval Harga Cryptocurrency Ethereum Dengan LSTM yang Terintegrasi dengan Lower-Upper Bound Estimation
Nafiz, Muhammad
Long Short-Term Memory (LSTM) merupakan salah satu jenis Recurrent Neural Network yang efektif dalam menangkap ketergantungan jangka panjang pada data deret waktu. Namun demikian peramalan pada metode ini pada umumnya hanya menyajikan nilai peramalan berupa titik dan tidak mencakup peramalan nilai  selang yang merupakan nilai penting untuk diketahui. Ethereum, seperti mata uang kripto lainnya, mengalami volatilitas harga tinggi yang disebabkan oleh faktor faktor seperti sentimen pasar, perubahan peraturan, adopsi teknologi, dan kondisi ekonomi global. Volatilitas ini menghadirkan tantangan yang signifikan untuk peramalan harga, karena pergerakan harga dapat menjadi tajam dan tidak dapat diprediksi dalam jangka pendek. Penelitian ini berfokus pada model peramalan  interval pada data Ethereum dengan mengintegrasikan jaringan Long Short-Term Memory (LSTM) dengan Lower-Upper Bound Estimation (LUBE) dimana memberikan batas atas dan bawah yang mencerminkan ketidakpastian pasar. Dataset yang digunakan terdiri dari data harga harian Ethereum dari 9 September 2017 hingga 12 Mei 2025. Dua pendekatan peramalan digunakan: peramalan titik menggunakan LSTM standar dan peramalan interval menggunakan kerangka kerja LSTM-LUBE. Hasil penelitian menunjukkan bahwa model peramalan titik &#13;
mencapai akurasi yang baik, dengan Mean Absolute Percentage Error (MAPE) sekitar 4,82% pada set pelatihan dan 3,6% pada set pengujian. Model prediksi interval menunjukkan keandalan yang kuat, karena semua pengamatan aktual berada dalam interval yang diprediksi. Selain itu, interval secara dinamis menyesuaikan dengan kondisi pasar - melebar selama periode volatilitas tinggi dan menyempit ketika pasar stabil. Hal ini mengindikasikan bahwa model yang diusulkan tidak hanya memberikan estimasi titik yang akurat, tetapi juga secara efektif menangkap ketidakstabilan pasar.; Long Short-Term Memory (LSTM) is a type of Recurrent Neural Network that is effective in capturing long-term dependencies in time series data. However, forecasting in this method generally only presents point forecasting values and does not include interval value forecasting which is an important value to know. Ethereum, like other cryptocurrencies, experiences high price volatility caused by factors such as market sentiment, regulatory changes, technology adoption, and global economic conditions. This volatility presents significant challenges for price forecasting, as price movements can be sharp and unpredictable in the short term. This research focuses on an interval forecasting model on Ethereum data by integrating a Long Short-Term Memory (LSTM) network with Lower-Upper Bound Estimation (LUBE) which provides upper and lower bounds that reflect market uncertainty. The dataset used consists of daily Ethereum price data from September 9, 2017 to May 12, 2025. Two forecasting approaches were used: point forecasting using standard LSTM and interval forecasting using the LSTMLUBE framework. The results show that the point forecasting model achieves good accuracy, with a Mean Absolute Percentage Error (MAPE) of about 4.82% on the training set and 3.6% on the testing set. The interval prediction model shows strong reliability, as all actual observations fall within the predicted interval. Moreover, the intervals dynamically adjust to market conditions - widening during periods of high volatility and narrowing when the market stabilizes. This indicates that the proposed model not only provides accurate point estimates, but also effectively captures market instability.
</summary>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Identifikasi Faktor Penting dalam Klasifikasi Pengalaman Kerawanan Pangan di Pulau Papua dengan Ensemble Variable Importance Berbasis Algoritma Genetika</title>
<link href="http://repository.ipb.ac.id/handle/123456789/172974" rel="alternate"/>
<author>
<name>Riyanto, Indra Mahib Zuhair</name>
</author>
<id>http://repository.ipb.ac.id/handle/123456789/172974</id>
<updated>2026-04-22T02:50:52Z</updated>
<published>2026-01-01T00:00:00Z</published>
<summary type="text">Identifikasi Faktor Penting dalam Klasifikasi Pengalaman Kerawanan Pangan di Pulau Papua dengan Ensemble Variable Importance Berbasis Algoritma Genetika
Riyanto, Indra Mahib Zuhair
Variable importance (VI) merupakan aspek penting dalam model machine learning (ML). Namun, algoritma ML yang berbeda sering kali menghasilkan peringkat VI yang berbeda, sehingga menyulitkan interpretasi. Penelitian ini mengkaji permasalahan tersebut dalam kasus klasifikasi kerawanan pangan di wilayah rentan Pulau Papua, di mana tingginya angka kemiskinan dan keterbatasan akses layanan dasar memerlukan intervensi yang tepat sasaran. Penelitian ini menggunakan data Survei Sosial Ekonomi Nasional Maret 2024 yang mencakup 11.016 rumah tangga. Penelitian ini melatih empat model ML, yaitu Random Forest, XGBoost, Multilayer Perceptron, dan Regresi Logistik, dengan strategi penanganan ketidakseimbangan kelas untuk mengklasifikasikan status kerawanan pangan berdasarkan Food Insecurity Experience Scale. Algoritma Genetika akan digunakan untuk menyusun ensemble variable importance (EVI) dengan memaksimalkan rata-rata terboboti dari korelasi Spearman setiap model ML dengan peringkat EVI. Pendekatan EVI berhasil mengintegrasikan berbagai VI model ML dengan rata-rata terboboti korelasi Spearman sebesar 0.912. Lima faktor utama yang teridentifikasi adalah provinsi, persentase pengeluaran rumah tangga untuk makan, proporsi kepemilikan tabungan dalam rumah tangga, status kelayakan bahan lantai, dan luas lantai bangunan per jiwa. Dominasi peubah provinsi mendorong analisis lebih lanjut dengan pendekatan clustering, yang mengungkapkan bahwa relevansi faktor ekonomi bervariasi antar wilayah. Hasil penelitian ini menunjukkan kemampuan EVI dalam menghasilkan suatu peringkat kepentingan peubah yang representatif ketika terdapat variasi VI antarmetode ML. Hasil EVI yang didapat juga menunjukkan perlunya strategi intervensi berbasis wilayah guna mengatasi kerawanan pangan di wilayah rentan Pulau Papua.
</summary>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Pendeteksian Anomali Data Jumlah Wisatawan Mancanegara di Indonesia dengan Metode Copula-Based Outlier Detection</title>
<link href="http://repository.ipb.ac.id/handle/123456789/172969" rel="alternate"/>
<author>
<name>Prayoga, Nabil Bintang</name>
</author>
<id>http://repository.ipb.ac.id/handle/123456789/172969</id>
<updated>2026-04-21T23:42:35Z</updated>
<published>2026-01-01T00:00:00Z</published>
<summary type="text">Pendeteksian Anomali Data Jumlah Wisatawan Mancanegara di Indonesia dengan Metode Copula-Based Outlier Detection
Prayoga, Nabil Bintang
Anomali adalah pengamatan yang menyimpang dari pola historis dan dapat muncul dari hubungan ketergantungan antarpeubah. Copula-based outlier detection (COPOD) mengakomodasi beberapa peubah menggunakan distribusi marginal empiris dan struktur ketergantungan ekor untuk mengidentifikasi anomali. Penelitian ini bertujuan mendeteksi anomali data jumlah wisatawan mancanegara di Indonesia dengan mempertimbangkan peubah inflasi dan nilai tukar rupiah serta mengevaluasi penanganan anomali terhadap performa peramalan long short-term memory (LSTM). Data bulanan dari Januari 2000 hingga Desember 2025 yang diperoleh dari CEIC Data, Badan Pusat Statistik, dan Bank Indonesia digunakan dalam penelitian. Analisis mencakup eksplorasi data dan pembentukan feature engineering berdasarkan struktur data serta identifikasi lag, pendeteksian anomali menggunakan COPOD, dilanjutkan peramalan LSTM. Pendeteksian dilakukan berdasarkan dua belas peubah hasil feature engineering dan teridentifikasi sebelas periode sebagai anomali. Hasil peramalan menunjukkan akurasi lebih baik pada model sesudah penanganan dengan mean absolute percentage error, root mean square error, dan korelasi sebesar 7,494%, 99233, dan 0,864 pada data uji. Keefektifan tersebut tidak dapat dipisahkan dari ketepatan pendeteksian anomali. Penelitian lanjutan diharapkan dapat menambah peubah relevan dan mengembangkan feature engineering.; Anomalies are observations that deviate from historical patterns and can arise from dependencies between variables. Copula-based outlier detection (COPOD) accommodates multiple variables using empirical marginal distributions and tail dependence structures to identify anomalies. This study aims to detect anomalies in the number of international tourists in Indonesia by considering the variables of inflation and the rupiah exchange rate, as well as to evaluate the handling of anomalies on the forecasting performance of long short-term memory (LSTM). Monthly data from January 2000 to December 2025 obtained from CEIC Data, Statistics Indonesia, and Bank Indonesia were used in the study. The analysis includes data exploration and the development of feature engineering based on the data structure and lag identification, anomaly detection using COPOD, followed by LSTM forecasting. Detection was carried out based on twelve variables resulting from feature engineering, and eleven periods were identified as anomalies. The forecasting results show better accuracy in the model after handling with a mean absolute percentage error, root mean square error, and correlation of 7.494%, 99233, and 0.864 on the test data. This effectiveness cannot be separated from the accuracy of anomaly detection. Further research is expected to add relevant variables and develop feature engineering.
</summary>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Implementasi Model IndoBERT Untuk Menangani Ketidakseimbangan Data Dalam Analisis Sentimen Ulasan Aplikasi KAI Access</title>
<link href="http://repository.ipb.ac.id/handle/123456789/172929" rel="alternate"/>
<author>
<name>Listyowati, Dyah</name>
</author>
<id>http://repository.ipb.ac.id/handle/123456789/172929</id>
<updated>2026-04-13T08:38:31Z</updated>
<published>2026-01-01T00:00:00Z</published>
<summary type="text">Implementasi Model IndoBERT Untuk Menangani Ketidakseimbangan Data Dalam Analisis Sentimen Ulasan Aplikasi KAI Access
Listyowati, Dyah
Analisis sentimen adalah proses pengolahan data tekstual untuk meneliti pendapat atau opini mengenai entitas tertentu. Analisis sentimen dapat diterapkan dalam berbagai hal, salah satunya pada aplikasi KAI Access. Penelitian ini menggunakan 4359 data ulasan aplikasi KAI Access dari bulan Juni 2025-Agustus 2025 yang diklasifikasikan ke kelas positif, negatif dan netral. Penelitian akan mengimplementasikan IndoBERT, salah satu model Bidirectional Encoder Representation from Transformers (BERT) monolingual dengan penerapan Synthetic Minority Over-sampling Technique dan Random Oversampling sebagai metode penanganan yang sering digunakan untuk menangani data tak seimbang. Tujuan dari penelitian ini adalah mengimplementasikan metode untuk penanganan data tak seimbang dan membandingkan model untuk menangani ketidakseimbangan sentimen ulasan pengguna pada aplikasi KAI Access. Data akan dibagi menjadi tiga yaitu 80% data latih, 10% data validasi dan 10% data uji. Penelitian ini menggunakan tiga skenario yaitu IndoBERT, IndoBERT dengan SMOTE, dan IndoBERT dengan ROS. Dari ketiga skenario tersebut, akurasi yang dihasilkan oleh model IndoBERT tanpa penanganan memiliki hasil yang terbaik namun evaluasi mendalam menunjukan bahwa model dengan SMOTE memiliki performa yang baik untuk kelas minor pada kasus data tak seimbang.
</summary>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</entry>
</feed>
