Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/92287
Title: Perbandingan Regresi Logistik Ordinal dan Diskriminan Kernel (Studi Kasus Klasifikasi Perguruan Tinggi di Indonesia).
Authors: Aidi, uhammad Nur
Sumertajaya, Made
Crystine, Amelia
Issue Date: 2018
Publisher: Bogor Agricultural University (IPB)
Abstract: Fokus sebuah metode klasifikasi adalah memisahkan objek-objek dan mengalokasikan objek baru pada kelompok yang telah tersefinisi (Johnson dan Wichern, 2007). Pemenuhan asumsi dalam penggunaan sebuah metode klasifikasi menjadi suatu kunci dalam memaksimalkan kinerja metode klasifikasi tersebut. Analisis diskriminan linier pada umumnya digunakan pada populasi yang peubah bebasnya berdistribusi normal ganda dan matriks ragam-peragamnya adalah homogen pada tiap kelompoknya. Adanya pelanggaran terhadap asumsi dapat menurunkan ketepatan prediksi klasifikasi. Analisis diskriminan kernel diperkenalkan untuk melengkapi dunia pengklasifikasian dimana data yang digunakan tidak harus memenuhi asumsi tertentu, termasuk asumsi homogenitas ragam (Khattre dan Naik, 2000). Menurut Mattjik dan Sumertajaya (2011) analisis diskriminan digunakan pada kasus dimana peubah respon berupa data kualitatif dan peubah penjelas berupa data kuantitatif. Keterbatasan analisis diskriminan dalam memfasilitasi data peubah bebas dapat diatasi oleh regresi logistik yang mampu mengamokodir peubah bebas berupa data kualitatif, kuantitatif, atau campuran keduanya. Model yang terbentuk pada regresi logistik merupakan model peluang kumulatif yang dapat menjadi pertimbangan klasifikasi, dimana penggunaan metode ini tidak didasarkan atas asumsi normalitas dan homogenitas ragam. Pada umumnya respon dari regresi logitik merupakan bilangan berskala ordinal maupun nominal yang terdiri dari dua atau lebih kategori. Regresi logistik ordinal digunakan untuk memodelkan sebuah kasus dengan repon yang memiliki urutan tertentu, sedangkan regresi logistik multinomial digunakan untuk model dengan respon yang tidak menunjukan suatu tingkatan atau urutan tertentu. Pada penelitian ini dikaji kinerja dari analisis regresi logistik dan diskriminan kernel dalam mengklasifikasikan data dengan adanya karakteristik keragaman tiap kelompok yang berbeda. Model regresi logistik yang digunakan adalah regresi logistik ordinal sedangkan fungsi yang digunakan dalam diskriminan kernel adalah fungsi epanechnikov dan normal. Pemilihan penggunaan fungsi kernel didasarkan atas tabel efisiensi yang disediakan oleh Silverman (1986) yang menunjukan bahwa kernel epanechnikov merupakan fungsi kernel yang memiliki tingkat efisiensi paling tinggi yaitu ≈ 1 sedangkan untuk fungsi kernel normal didasarkan atas asumsi awal diskriminan yang memerlukan pendekatan distribusi normal. Terdapat dua analisis dalam penelitian ini yaitu : (1) kajian simulasi yang digunakan untuk melihat pengaruh keragaman dan jarak pusat antar kelompok pada skenario simulasi data ragam sama dan data ragam tidak sama yang terdiri dari empat (4) kelompok, (2) studi kasus Klasifikasi Perguruan Tinggi di Indonesia yang digunakan untuk memperoleh kesesuaian antara hasil kajian simulasi dengan data riil. Kajian simulasi menunjukan bahwa ketiga metode menghasilkan prediksi klasifikasi yang baik untuk data ragam sama dengan nilai ketepatan prediksi klasifikasi yang hampir sama. Pada saat sebuah data memiliki keragaman yang tidak homogen untuk setiap kelompoknya, analisis diskriminan kernel epanechnikov dan normal dapat memberikan ketepatan klasifikasi lebih baik dibandingkan analisis regresi logistik. Terdapat respon yang sama pada ketiga metode ketika digunakan pada klasifikasi dengan karakteristik keragaman yang besar, yaitu menyebabkan penurunan ketepatan prediksi klasifikasi. Jarak pusat antar kelompok yang semakin berjauhan akan menyebabkan objek-objek antar kelompok dipisahkan dengan baik dan diklasifikasikan dengan tepat untuk regresi logistik ordinal, sedangkan pada diskriminan kernel akan terjadi penurunan kinerja klasifikasi pada saat jarak antar kelompok semakin jauh dengan adanya karakteristik keragaman kelompok yang berbeda. Analisis dengan menggunakan data studi kasus tidak menunjukan kesesuaian dengan hasil kajian simulasi. Ketepatan klasifikasi tertinggi dihasilkan oleh diskriminan kernel normal dan regresi logsitik ordinal yaitu sebesar 90,82% dan 88,94% untuk data training, sedangkan untuk data testing yaitu sebesar 88,98% dan 85,86% dengan karakteristik keragaman antar kelompok berbeda dan jarak pusat tiap kelompok yang semakin berjauhan. Hal ini disebabkan karena adanya faktor pemilihan nilai bandwidth yang dipengaruhi oleh keragaman antar kelompok baik secara langsung maupun tidak langsung yang dapat menurunkan kinerja ketepatan klasifikasi dari fungsi kernel. Di sisi lain, permasalahan ketidakseimbangan data yang diabaikan dalam analisis studi kasus dimungkinkan juga menjadi penyebab akan adanya ketidaksesuaian serta ketidakkonsistenan metode dalam memprediksi ketepatan klasifikasi.
URI: http://repository.ipb.ac.id/handle/123456789/92287
Appears in Collections:MT - Mathematics and Natural Science

Files in This Item:
File SizeFormat 
2018acr.pdf
  Restricted Access
18.05 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.