Penerapan Algoritme Smotebagging Dalam Penyusunan Pohon Keputusan Dan Regresi Logistik Untuk Kajian Kredit Macet.
View/ Open
Date
2015Author
Hanifah, Fithria Siti
Wijayanto, Hari
Kurnia, Anang
Metadata
Show full item recordAbstract
Permasalahan yang sering ditemui dalam kasus klasifikasi adalah masalah data tidak seimbang yang merupakan kondisi dimana salah satu atau lebih kelas mendominasi kelas yang lain. Data tidak seimbang akan menghasilkan bias terhadap kelas dengan jumlah contoh yang lebih besar (mayor) karena pengklasifikasi akan cenderung memprediksi data kelas mayor, sedangkan kelas minor akan cenderung diabaikan (dianggap sebagai noise), sehingga data amatan pada kelas minor tidak dapat diklasifikasikan dengan benar. Untuk banyak kasus, kesalahan memprediksi objek dari kelas minor dapat memberikan resiko lebih besar dibanding dengan kesalahan memprediksi objek dari kelas mayor. Penelitian ini mendiskusikan salah satu teknik penanganan masalah data tidak seimbang, yaitu SMOTEBagging. SMOTEBagging merupakan kombinasi dari metode SMOTE (Synthetic Minority Oversampling Technique) dan Bagging (Bootstrap Aggregating), dimana metode SMOTE akan dilibatkan dalam proses bagging, yaitu membangkitkan data buatan pada gugus data hasil proses bootsrap. Pohon Keputusan dengan algoritme CART (Classification and Regression Tree) dan regresi logistik merupakan pengklasifikasi yang akan digunakan pada setiap gugus data yang diperoleh. Data yang digunakan pada penelitian ini merupakan data sekunder yang diambil dari salah satu Bank di Indonesia, Bank X, yaitu data nasabah kredit tanpa agunan. Peubah yang digunakan dalam penelitian ini merupakan karakteristik nasabah yang dinilai dalam credit scoring, yaitu sebanyak 17 peubah penjelas. Berdasarkan hasil analisis, SMOTEBagging terbukti dapat meningkatkan kinerja klasifikasi pada data tidak seimbang pada pengklasifikasian data credit scoring pada kasus ini. Hal ini ditunjukkan dengan nilai AUC dan kepekaan yang lebih baik dibandingkan dengan model tanpa SMOTEBagging. Berdasarkan nilai AUC, pengklasifikasian credit scoring dengan menggunakan model regresi logistik lebih baik dibandingkan dengan model CART, baik dengan penerapan algoritme SMOTEBagging maupun tidak. Sedangkan berdasarkan nilai kepekaan, model CART lebih baik dibanding dengan regresi logistik untuk model tanpa SMOTEBagging, dan model regresi logistik lebih baik dibanding dengan CART untuk model dengan SMOTEBagging. Sementara itu, model dengan penerapan algoritme SMOTEBagging memiliki nilai AUC dan kepekaan yang lebih tinggi dibanding dengan model tanpa SMOTEBagging meskipun nilai kehususannya menurun. Oleh karena pada penelitian ini berfokus pada kelas minor (kredit macet), maka berdasarkan pada kepentingan dalam penelitian ini diambil kesimpulan bahwa SMOTEBagging dapat menaikkan tingkat akurasi model kelas minor.