Churn Analysis and Prediction For A Product Customer Based on Survival Analysis and Random Forest
View/ Open
Date
2020Author
Gemilang, Kevin Cesio
Saefuddin, Asep
Fitrianto, Anwar
Metadata
Show full item recordAbstract
Salah satu tantangan yang dihadapi perusahaan adalah loyalitas konsumen. Loyalitas konsumen biasanya ditunjukkan oleh tingkat churn konsumen. Loyalitas konsumen telah disarankan menjadi salah satu masalah yang dihadapi oleh banyak perusahaan di era sekarang ini. Pada perusahaan dengan skala besar dan luas, churn menjadi masalah berkurangnya laba perusahaan. Oleh karena itu perusahaan perlu mengembangkan metodologi yang konsisten dan sistematis untuk menangani churn konsumen. Hal ini dapat diatasi dengan analisis daya tahan dan random forest untuk menghasilkan solusi penangan konsumen churn. Analisis daya tahan digunakan untuk memberikan label churn atau tidak pada konsumen dengan mempertimbangkan definisi yang diberikan perusahaan untuk konsumen churn seberapa lama konsumen tidak kembali berbelanja. Setelah pelabelan dilakukan, baru dapat dilakukan pembentukan model prediksi untuk konsumen menggunakan random forest. Dalam analisis daya tahan delapan puluh persen dari konsumen loyal di perusahaan ritel ini memiliki karakteristik untuk melakukan pembelian kembali setelah hari ke-121 pasca transaksi pertama mereka, hal ini digunakan untuk melabelkan konsumen agar dapat dibentuk model prediksi. Random forest sebagai salah satu metode supervised learning dapat menggambarkan masalah churn konsumen. Menggunakan nilai hyperparameter random forest yang telah dioptimalkan dapat menghasilkan kinerja random forest yang cukup baik untuk menggambarkan churn konsumen. Akurasi total model ini adalah 77.60% , sensitivitas 82.25% dan spesifisitas 68.76%. Namun untuk dapat menggambarkan konsumen churn dengan data tidak seimbang diperlukan perhitungan precision, recall, dan f1 score. Peneliti mendapatkan 83.35% pada precision, 82.25% pada recall, dan 82.80% pada f1 score. Terakhir nilai AUC yang diperoleh adalah 0.810. Random Forest mengindikasi bahwa rata-rata transaksi dan jumlah pengeluaran rata-rata adalah faktor utama yang dapat membedakan churn konsumen dan bukan. Random Forest juga menyimpulkan bahwa penggunaan saluran otomatis dan manual untuk berbelanja tidak secara signifikan memengaruhi churn konsumen. Setelah performa random forest cukup baik dibentuk web app sederhana untuk melakukan pengotomatisan prediksi churn konsumen.