Penggunaan Analisis Biplot dan Jarak Euclid dengan Ukuran Procrustes untuk Deteksi Pencilan
Abstract
Pencilan merupakan suatu objek dengan kombinasi yang unik yang
memunyai karakteristik berbeda dengan objek lainnya. Keberadaan pencilan
menimbulkan kesalahan dalam menyimpulkan data akibat, pada nilai ragam yang
terlalu besar. Metode yang dapat digunakan untuk mendeteksi pencilan adalah
determinam koragam minimum (DKM). Metode ini menggunakan rataan dari
objek-objek homogen sebagai pusat data yang kekar. Sayangnya, penentuan
matriks homogen memerlukan iterasi yang panjang sehingga metode alternatif
ditawarkan dalam penelitian ini untuk menduga pencilan dengan biplot (langsung
dan tak langsung) dan jarak Euclid (langsung dan tak langsung).
Metode biplot langsung dilakukan dengan mencari jarak antara titik-titik
koordinat biplot dengan sentroid. Jarak-jarak diurutkan kemudian dicari batas atas
kuartil. Objek yang memunyai jarak lebih besar dari batas atas merupakan
pencilan. Sedangkan pada metode jarak Euclid langsung dilakukan dengan
mencari jarak Euclid data asal dengan sentroid. Jarak-jarak diurutkan kemudian
dicari batas atas kuartil. Objek yang memunyai jarak lebih besar dari batas atas
merupakan pencilan. Analisis biplot tak langsung dilakukan dengan mencari titiktitik
koordinat biplot kemudian memilih beberapa objek yang dikategorikan
sebagai objek-objek homogen. Rataan dan koragam objek-objek homogen dicari
sebagai pusat data. Jarak Mahalanobis antara pusat data dengan setiap titik objek
dihitung. Objek yang memunyai jarak Mahalanobis di luar batas Khi-kuadrat
merupakan pencilan. Metode dengan jarak Euclid tak langsung dilakukan dengan
tahapan serupa namun data yang digunakan merupakan data asal dan jarak yang
digunakan merupakan jarak Euclid.
Analisis pendahuluan dilakukan untuk mengetahui performa metode. Pada
data dengan calon pencilan, calon pencilan atas dan bawah, dan data tanpa
pencilan semua metode dapat menyimpulkan hasil sesuai hipotesis. Pada data dua
kelompok dan tiga kelompok dengan sentroid berada di tengah hasil analisis tidak
dapat dipercaya karena 1) objek-objek yang dikategorikan sebagai matriks
homogen nyatanya merupakan objek-objek yang tidak homogen 2) objek yang
didefinisikan pencilan merupakan objek yang memunyai jarak yang dekat dengan
objek lain. Pada data laporan keuangan bank, bank yang dikategorikan sebagai
pencilan adalah Bank I, K dan H. Metode terbaik untuk mendeteksi pencilan pada
data laporan keuangan bank umum syariah adalah biplot langsung dan tak
langsung. Pada data provinsi, daerah yang dikategorikan pencilan yaitu provinsi
DKI Jakarta dan Papua. Semua metode menyimpulkan hal yang sama dengan
ukuran kesesuaian sebesar 0.2968. Pada analisis lanjutan, metode terbaik untuk
mendeteksi pencilan adalah jarak Euclid langsung, Euclid tak langsung dan biplot
tak langsung.