Show simple item record

dc.contributor.advisorSadik, Kusman
dc.contributor.advisorKurnia, Anang
dc.contributor.authorKhotimah, Khusnul
dc.date.accessioned2021-03-27T06:39:54Z
dc.date.available2021-03-27T06:39:54Z
dc.date.issued2021
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/106435
dc.description.abstractSuatu amatan dengan nilai yang sangat jauh berbeda dengan kebanyakan data lainnya atau sering disebut sebagai pencilan sangat memengaruhi kinerja metode kuadrat terkecil (MKT) dalam pendugaan regresi linier. Adanya amatan pencilan ini dapat mengurangi kekuatan metode pendugaan. Terdapat 3 jenis pencilan, yaitu vertical outlier (VO), good leverage point (GLP), dan bad leverage point (BLP). Selain pencilan, pada kasus regresi linier berganda yaitu regresi linier dengan lebih dari satu peubah penjelas, kinerja MKT dalam pendugaan parameter juga dapat terganggu oleh adanya hubungan antar peubah penjelas (masalah multikolinieritas). Penelitian ini mengkaji metode gabungan penanganan pencilan dengan penanganan multikolinieritas dalam analisis regresi linier berganda pada himpunan data yang mengandung kedua masalah tersebut sekaligus. Metode least median square (LMS) dan multi-stage methods (MM) digunakan sebagai metode kekar penanganan pencilan. Metode penanganan multikolinieritas yang digunakan dalam penelitian ini adalah Gulud, Liu, dan generalized Liu-type estimator (GLTE). Dengan demikian, penelitian ini mengkaji metode Gulud-LMS, Gulud-MM, Liu-LMS, Liu-MM, GLTE-LMS, dan GLTE-MM. Kajian dilakukan melalui proses simulasi dan aplikasi pada data aktual. Simulasi dilakukan dengan membangkitkan empat peubah penjelas (X) yang diberi berbagai skenario ukuran data (n), tingkat korelasi (ρ), tipe pencilan, dan persentase pencilan (δ). Adapun data aktual yang digunakan adalah produksi kelapa sawit Indonesia tahun 2018 dengan empat peubah penjelas (X_1,X_2,X_3,X_4) secara berturut-turut ialah luas perkebunan milik negara, swasta, rakyat, dan luas perkebunan yang mengalami kerusakan. Kinerja metode yang digunakan dinilai berdasarkan kriteria evaluasi bias relatif mutlak dugaan parameter, root mean square error (RMSE) dugaan parameter, dan RMSE prediksi model. Suatu metode memiliki kinerja yang baik apabila memiliki nilai kriteria evaluasi yang rendah. Proses simulasi menghasilkan beberapa kesimpulan. GLTE-MM memiliki kinerja terbaik untuk analisis regresi linier berganda pada data yang terdapat masalah multikolinieritas dan pencilan VO saat ukuran data 50 dan 300 dengan tingkat korelasi 0.8 dan 0.9 serta persentase pencilan 0.1 dan 0.2, selainnya metode Gulud-MM lebih baik. Metode dengan kinerja paling baik untuk analisis regresi berganda suatu himpunan data yang mengandung masalah multikolinieritas dan pencilan tipe GLP adalah GLTE. Liu-MM tepat digunakan untuk analisis regresi berganda suatu himpunan data yang mengandung masalah multikolinieritas dan pencilan tipe BLP saat ukuran data 25 dan 50 pada setiap kondisi tingkat korelasi dan persentase pencilan. Adapun saat kondisi ukuran data 300 metode GLTE-MM lebih tepat digunakan. Selaras dengan hasil yang diperoleh dari proses simulasi, metode dengan kinerja terbaik dalam analisis regresi berganda data produksi kelapa sawit 2018 dengan ukuran data 25 dan terdeteksi mengandung pencilan serta multikolinieritas adalah Liu-MM.id
dc.description.abstractAn observation with a value that is very different from most other data or is often referred to as outliers greatly affects the performance of the least squares method (OLS) in estimating linear regression. The existence of these outlier observations can reduce the power of the prediction method. There are 3 types of outliers, namely vertical outliers (VO), good leverage points (GLP), and bad leverage points (BLP). Apart from outliers, in the case of multiple linear regression, namely linear regression with more than one explanatory variable, the performance of OLS in parameter estimation can also be disrupted by the relationship between explanatory variables (or is often called as multicollinearity). This study examines the combined method of handling outliers method with multicollinearity handling method in multiple linear regression analysis on a data set containing both problems at once. The least median square (LMS) and multi-stage methods (MM) methods were used as a robust method of handling outliers. The multicollinearity handling methods used in this study were ridge, Liu, and generalized Liu-type estimator (GLTE). Thus, this study examines the ridge-LMS, ridge-MM, Liu-LMS, Liu-MM, GLTE-LMS, and GLTE-MM. The study is carried out through a simulation process and application of actual data. The simulation is done by generating four explanatory variables (X) given various scenarios of data size (n), correlation level (ρ), type of outliers, and percentage of outliers (δ). The actual data used is Indonesian oil palm production in 2018 with four explanatory variables (X_1,X_2,X_3,X_4), namely the area of state-owned, private, people's plantations, and the area of damaged plantations, respectively. The performance of the method used was assessed based on the evaluation criteria of the relative absolute bias of parameter estimates, the root mean square error (RMSE) of estimated parameters, and the RMSE of model predictions. A method has a good performance if it has a low evaluation criteria value. The simulation process produces several conclusions. GLTE-MM has the best performance for multiple linear regression analysis on data with multicollinearity problems and VO outliers when data sizes are 50 and 300 with correlation levels 0.8 and 09 and outlier percentages 0.1 and 0.2, besides the Gulud-MM method is better. The method with the best performance for multiple regression analysis of a data set that contains a multicollinearity problem and an outlier type of good leverage point is GLTE. Liu-MM is suitable for multiple regression analysis of a data set that contains multicollinearity problems and outliers of the bad leverage type when the data sizes are 25 and 50 for each condition of the level of correlation and the percentage of outliers. Meanwhile, when the data size condition is 300, the GLTE-MM method is more appropriate. Aligned with the simulation results, the best performance method in the multiple regression analysis on the 2018 oil palm production data with size 25, contain outliers and multicollinearity is Liu-MM.id
dc.language.isoidid
dc.publisherIPB Universityid
dc.titleKajian Pemodelan Gabungan Metode Penanganan Pencilan (LMS, MM) dengan Metode Penanganan Multikolinieritas (Gulud, Liu, GLTE)id
dc.title.alternativeModeling Study of Combined Outliers Handling Methods (LMS, MM) with Multicollinearity Handling Method (Ridge, Liu, GLTE)id
dc.typeThesisid
dc.subject.keywordgeneralized Liu-type estimatorid
dc.subject.keywordleast median squareid
dc.subject.keywordLiu-estimatorid
dc.subject.keywordmulti-stage methodid
dc.subject.keywordridge-estimatorid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record