Analisis Regresi Logistik dan CART untuk Credit Scoring dengan Penanganan Kelas Tak Seimbang
Abstract
Tidak adanya jaminan pada suatu jenis kredit akan membuat risiko kredit (gagal bayar) yang dihadapi oleh pihak bank semakin tinggi. Penerapan prinsip kehati-hatian oleh bank diterapkan dengan mengelola portofolio kredit yang dimiliki, sehingga potensi risiko yang terjadi dapat diukur dan dikontrol dalam suatu model. Credit scoring menggambarkan seberapa besar kemungkinan debitur akan macet dengan pembayaran. Pada penelitian ini dibandingkan pemodelan credit scoring antara analisis regresi logistik dan Classification and Regression Trees (CART) dalam mengklasifikasikan debitur yang nantinya dapat digunakan oleh bank untuk membuat atau mengevaluasi kebijakan terkait kredit. Permasalahan klasifikasi pada ketidakseimbangan kelas salah satunya dapat ditangani dengan Synthetic Minority Oversampling Technique (SMOTE). Hasil penelitian ini menunjukkan bahwa analisis Regresi Logistik dengan penanganan SMOTE menghasilkan kinerja yang lebih baik karena memiliki nilai sensitifitas yang lebih tinggi daripada analisis CART dan tidak terdapat perbedaan nilai terlalu besar pada nilai Area Under Curve (AUC). Peubah yang berpengaruh signifikan dalam klasifikasi debitur (lancar, macet) adalah tingkat pendidikan, status kepemilikan rumah, dan pendapatan. The absence of collateral for a type of credit will increase the bank's credit risk (failed to pay). Banks apply the precautionary principle by managing their credit portfolios so that potential hazards that occur can be measured and controlled in a model. Credit scoring describes how likely a debtor will fail with payments. This study aimed to compare logistic regression analysis and Classification and Regression Trees (CART) in classifying debtors to evaluate credit policies. One of the problems in classification is unbalanced data. Synthetic Minority Oversampling Technique (SMOTE) is a technique to handle the unbalanced problem in classification. The results show that the logistic regression model with SMOTE has higher sensitivity than the CART model, and there was no difference in Area Under Curve (AUC). The variables that have significant effects on the classification of debtors (good, bad) are level of education, homeownership status, and income.