Analisis Komponen Utama bagi Data dengan Pencilan Menggunakan Projection Pursuit dan Penduga Robust Minimum
Date
2022Author
Reflina, Yelia Putri
Ardana, Ngakan Komang Kutha
Sumarno, Hadi
Metadata
Show full item recordAbstract
Pengelolaan data yang memiliki jumlah peubah dan observasi yang besar
tidak dapat dilakukan dengan cara yang biasa. Data yang rumit dan besar seringkali
memerlukan pengolahan data yang khusus, baik dalam tahap analisis maupun
visualisasi. Analisis Komponen Utama (AKU) merupakan teknik analisis statistika
yang mampu mereduksi data dan mentransformasi peubah-peubah asli yang masih
saling berkorelasi satu dengan yang lain menjadi satu set peubah baru yang kecil
dan tidak berkorelasi satu sama lain. Pencilan (outliers) akan sangat mempengaruhi
analisis data sehingga diperlukan analisis dengan suatu pendekatan yang kekar
(robust) dengan pencilan. Model yang digunakan untuk data dengan pencilan
adalah AKU kekar ROBPCA yang menggabungkan konsep projection pursuit dan
estimator Minimum Covariance Determinant. Simulasi dilakukan dengan
menggunakan data tanpa pencilan, data dengan proporsi pencilan 5% dan data
dengan 10% pencilan. Berdasarkan ukuran kesesuaian dalam menganalisis
komponen utama, AKU kekar ROBPCA lebih baik dibandingkan AKU Klasik.
Selain itu berdasarkan plot tebaran score distance dan orthogonal distance, AKU
kekar ROBPCA lebih efektif dalam mendeteksi pencilan dibandingkan dengan
AKU Klasik. Processing data that has a large number of variables and observations can not
be managed in the usual way. Complex and large data often require special data
processing, both in the analysis and visualization processes. Principal Component
Analysis (PCA) is a statistical analysis technique that can reduce data and transform
the original variables that are still correlated with each other into a new set of small
and uncorrelated variables. Outliers will significantly affect data analysis, so
analysis with a robust approach towards outliers is needed. The model used for data
with outliers is the ROBPCA which combines the concepts of projection pursuit
and the Minimum Covariance Determinant estimator. The simulation was carried
out using data without outliers, data with 5% outlier proportions, and data with 10%
outliers. Based on the suitability measure in analyzing the principal components,
ROBPCA is better than the classical PCA. In addition, based on the scatter plot of
the distance score and orthogonal distance, ROBPCA is more effective in detecting
outliers than the classical PCA.
Collections
- UT - Mathematics [1365]