Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/169216| Title: | Kajian Performa Penduga Selang Prediksi Hasil Pemodelan Random Forest pada Data yang Peubah Penjelasnya Saling Berkorelasi |
| Other Titles: | |
| Authors: | Sartono, Bagus Wijayanto, Hari ILMA, MEISYATUL |
| Issue Date: | 2025 |
| Publisher: | IPB University |
| Abstract: | Korelasi tinggi antar peubah penjelas merupakan tantangan dalam pemodelan regresi prediktif karena dapat menimbulkan multikolinearitas yang berdampak pada kestabilan penduga dan interpretasi model. Algoritma Random Forest merupakan metode nonparametrik yang mampu memodelkan hubungan nonlinier serta mengakomodasi struktur data berdimensi tinggi tanpa memerlukan spesifikasi eksplisit terhadap bentuk fungsi regresi maupun asumsi tertentu pada sebaran galat. Random Forest menghasilkan penduga titik tanpa disertai informasi mengenai ketidakpastian. Keterbatasan ini mengurangi relevansi penggunaan model dalam konteks analisis yang memerlukan estimasi selang atau tingkat keyakinan terhadap hasil prediksi. Pembentukan penduga selang prediksi penting untuk merepresentasikan variabilitas secara kuantitatif, sehingga hasil prediksi tidak hanya akurat tetapi juga informatif secara statistik. Penelitian ini bertujuan mengkaji kinerja tiga metode pembentukan penduga selang prediksi berbasis Random Forest, yaitu Out-of-Bag Prediction Interval (OOB-PI), Quantile Regression Forest (QRF), dan Split Conformal Prediction (SC). Evaluasi dilakukan melalui dua pendekatan, yaitu pertama adalah studi simulasi yang melibatkan variasi tingkat korelasi antar peubah penjelas, bentuk fungsi rata-rata, sebaran galat, dan ukuran contoh. Masing-masing konfigurasi disimulasikan sebanyak 500 replikasi, dengan dua metrik evaluasi utama yaitu coverage rate dan lebar selang prediksi. Hasil menunjukkan bahwa OOB-PI memberikan performa paling efisien dengan lebar selang prediksi yang lebih sempit dan cakupan yang mendekati tingkat kepercayaan yang ditentukan. QRF menghasilkan coverage rate yang melebihi tingkat kepercayaan, namun disertai dengan selang prediksi yang relatif lebar. SC memberikan jaminan secara teoritis bahwa probabilitas cakupan selang prediksi sesuai dengan tingkat kepercayaan yang ditentukan, tanpa mensyaratkan asumsi tertentu terhadap sebaran data. Pendekatan kedua merupakan kajian empiris menggunakan data Survei Sosial Ekonomi Nasional (SUSENAS) Provinsi Jawa Barat tahun 2023. Data ini merepresentasikan kondisi aktual yang sering dijumpai dalam praktik, yakni struktur korelasi tinggi antar peubah penjelas. Analisis difokuskan pada enam kabupaten/kota dengan korelasi maksimum antar peubah penjelas di atas 0,74. Peubah respon yang digunakan adalah pengeluaran konsumsi makanan rumah tangga bulanan, sementara 24 peubah penjelas mencakup berbagai dimensi sosial ekonomi rumah tangga. Model Random Forest diimplementasikan dengan skema validasi silang 10-fold cross-validation dan tuning hyperparameter untuk setiap wilayah guna mengoptimalkan konfigurasi model. Analisis data SUSENAS 2023 pada enam wilayah di Provinsi Jawa Barat menunjukkan adanya perbedaan kinerja antarmetode dalam membentuk penduga selang prediksi. Metode OOB-PI menunjukkan performa paling seimbang, dengan coverage rate yang konsisten mendekati tingkat kepercayaan dan lebar selang prediksi yang relatif pendek serta stabil di seluruh wilayah. Metode SC menghasilkan coverage rate yang sedikit melebihi tingkat kepercayaan, namun efisiensinya menurun akibat lebar selang yang seragam dan kurang adaptif terhadap variasi lokal. Metode QRF menunjukkan performa paling tidak efisien, ditandai dengan coverage rate yang berada di bawah taraf kepercayaan serta lebar selang prediksi yang paling lebar, sehingga tidak memenuhi kriteria validitas maupun efisiensi pada data dengan korelasi tinggi. Hasil kajian empiris konsisten dengan hasil studi simulasi yang menunjukkan bahwa OOB-PI merupakan metode paling efisien dalam membentuk penduga selang prediksi, dengan cakupan yang valid dan lebar selang yang relatif sempit. Konsistensi performa ini menjadikan OOB-PI sebagai pendekatan yang paling direkomendasikan dalam pembentukan penduga selang prediksi pada pemodelan Random Forest, khususnya pada data dengan korelasi tinggi antar peubah penjelas. Metode ini memberikan estimasi yang presisi sekaligus menyertakan informasi ketidakpastian dalam bentuk selang prediksi yang dapat dievaluasi secara statistik, sehingga relevan untuk analisis sosial ekonomi. |
| URI: | http://repository.ipb.ac.id/handle/123456789/169216 |
| Appears in Collections: | MT - School of Data Science, Mathematic and Informatics |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| cover_G1501231073_9569f8b3b6a441ee8c4e673865efe108.pdf | Cover | 1.02 MB | Adobe PDF | View/Open |
| fulltext_G1501231073_67efbcfb33b44294aced2997a8c38cd0.pdf Restricted Access | Fulltext | 4.16 MB | Adobe PDF | View/Open |
| lampiran_G1501231073_debc08c83656445d9c4db5022614e8e6.pdf Restricted Access | Lampiran | 3.38 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.