Perbandingan Metode Supervised Learning dalam Memprediksi Data Cross Selling Asuransi Kesehatan dengan Asuransi Kendaraan
Abstract
Penelitian ini menggunakan metode supervised learning untuk memprediksi ketertarikan pemegang polis asuransi kesehatan dalam melakukan cross selling dengan asuransi kendaraan. Metode supervised learning menghasilkan fungsi yang memetakan input ke output yang diinginkan. Terdapat banyak metode supervised learning. Penelitian ini membandingkan metode regresi logistik dan random forest yang diterapkan pada data health insurance cross selling prediction yang diambil dari kaggle.com sebelum dan setelah diterapkan balancing data. Teknik balancing data yang digunakan adalah Synthetic Minority Oversampling Technique (SMOTE). Untuk data tersebut, diperoleh model dengan nilai sensitivitas tertinggi adalah regresi logistik setelah diterapkan teknik SMOTE yaitu sebesar 94,53%. Model dengan nilai area under curve dan f1- score tertinggi adalah random forest setelah diterapkan teknik SMOTE yaitu sebesar 88,67% dan 43,74%. Tiga peubah penjelas paling berpengaruh pada algoritma regresi logistik berdasarkan nilai deviance dan random forest berdasarkan nilai mean decrease gini adalah X5 (kepemilikan asuransi kendaraan sebelumnya), X7 (pernah atau tidak mengalami kecelakaan), dan X2 (umur). Kata Kunci: data cross selling, metode supervised learning, regresi logistik, random forest, SMOTE
Collections
- UT - Actuaria [142]