dc.description.abstract | Kelapa sawit merupakan salah satu komoditas potensial yang banyak
dibudidayakan dan minyak kelapa sawit sebagai salah satu olahannya merupakan
salah satu penyumbang devisa tertinggi bagi Indonesia. Analisis berbagai faktor
yang mempengaruhi produksi kelapa sawit dan dilanjutkan dengan peramalan
terhadap produksi kelapa sawit untuk periode waktu berikutnya menjadi penting
untuk dilakukan. Penelitian yang dilakukan selama ini banyak yang hanya dalam
lingkup mencari faktor-faktor yang mempengaruhi produksi kelapa sawit saja dan
membutuhkan pengujian asumsi terlebih dahulu, serta tidak dilanjutkan dengan
peramalan terhadap produksi kelapa sawit untuk waktu selanjutnya. Peramalan
terhadap produksi kelapa sawit yang dilakukan pun hanya terbatas pada satu peubah
saja yakni pada peubah respon tanpa memperhatikan pengaruh dari peubah bebas.
Terdapat beberapa kendala yang membuat pemodelan dan peramalan
terhadap produksi kelapa sawit menjadi sulit dilakukan, diantaranya banyak sekali
faktor yang mempengaruhi produksi kelapa sawit, data produksi kelapa sawit
memiliki pola non-linier, serta peubah yang digunakan terdiri dari peubah numerik
dan kategorik. Selain itu, diduga peubah bebas yang digunakan diduga memiliki
pengaruh pada waktu yang berbeda-beda terhadap produksi kelapa sawit atau
terdapat efek lag.
Salah satu metode yang dapat digunakan untuk melihat faktor-faktor yang
mempengaruhi produksi kelapa sawit adalah random forest yaitu metode pohon
gabungan yang berasal dari pengembangan metode classification and regression
tree (CART). Dengan demikian, metode yang digunakan dalam penelitian ini
adalah random forest lag distributed regression yakni analisis yang
menggabungkan metode lag distributed regression dan random forest. Analisis ini
tidak memerlukan pengujian asumsi karena merupakan analisis statistika
nonparametrik, selain itu, analisis ini juga mampu dalam mengatasi peubah yang
sangat banyak, dapat mengakomodir efek lag, melihat hubungan yang tidak linier,
melihat interaksi antar peubah, dapat digunakan untuk peubah numerik maupun
kategorik, serta cepat dalam hal komputasi. Tujuan dari penelitian ini adalah
melakukan pemodelan data dengan menggunakan analisis random forest lag
distributed regression, mengetahui faktor-faktor yang mempengaruhi produksi
kelapa sawit, dan melakukan peramalan data produksi kelapa sawit.
Berdasarkan penelitian, produksi kelapa sawit memiliki pola non-liniar.
Evaluasi terhadap model dilihat nilai korelasi sebesar 0.770. Ukuran evaluasi
lainnya dapat dilihat dengan nilai root mean squared error (RMSE) sebesar 59.029,
mean absolute error (MAE) sebesar 45.821, dan koefisien determinasi sebesar
0.176. Adapun 5 peubah penting dari model pertama yakni jumlah pohon per blok,
luas lahan (hektar), umur kelapa sawit, temperatur lag ke-9, kelembaban udara lag
ke-1. Model dengan hanya variabel-variabel penting dari model pertama yang
dipilih memiliki kinerja yang lebih baik daripada model dengan semua variabel.
Evaluasi model kedua diperoleh nilai korelasi sebesar 0.844. Ukuran evaluasi
lainnya dapat dilihat dengan nilai RMSE sebesar 35.634, MAE sebesar 24.573, dan
koefisien determinasi sebesar 0.699. Adapun 5 peubah penting dari model kedua
yakni jumlah pohon per blok, luas lahan (hektar), temperatur lag ke-9, kecepatan
angin lag ke-8, dan umur kelapa sawit. Pemodelan dengan hanya menggunakan
peubah penting memiliki kinerja yang lebih baik dibandingkan dengan pemodelan
menggunakan seluruh peubah. Peramalan data maksimum dapat dilakukan dengan
menggunakan lag minimum yang dipilih berdasarkan peubah penting dari model
pertama. Sehingga peramalan data produksi dilakukan untuk 1 bulan ke depan. | id |