Kajian Perbandingan Metode Survival Machine Learning dan Penerapannya Pada Data Daya Tahan Perusahaan Retail
Date
2023Author
Suantari, Ni Gusti Ayu Putu Puteri
Fitrianto, Anwar
Sartono, Bagus
Metadata
Show full item recordAbstract
Analisis daya tahan (survival analysis) merupakan suatu prosedur statistika untuk menganalisis data dengan peubah respon yaitu waktu hingga suatu kejadian terjadi (time to event). Random Survival Forest dan Survival Support Vector Machine adalah metode machine learning dikembangkan pada tipe metode nonparametrik untuk mengakomodir kondisi ketersediaan data yang besar. Data yang digunakan pada penelitian ini adalah data simulasi berupa data daya tahan tersensor kanan. Penelitian ini menggunakan package RandomForest SRC dan SurvivalSVM pada software R. Hasil simulasi pada data saya tahan tersensor kanan dengan skenario menggunakan peubah prediktor biner menunjukkan bahwa metode Survival Support Vector Machine (SSVM) dengan menggunakan Radial Basic Function Kernel (RBF) memiliki performa model yang terbaik pada data dengan volume kecil, sedangkan ketika volume data menjadi semakin besar, metode yang memiliki performa terbaik adalah Survival Support Vector Machine (SSVM) dengan menggunakan Additive Kernel (ADD). Sedangkan Random Survival Forest adalah metode yang memiliki performa terbaik untuk seluruh kondisi pada skenario menggunakan peubah prediktor campuran. Metode yang digunakan, proporsi data tersensor dan banyaknya data yang digunakan mempengaruhi performa model. .Penerapan dari survival analysis ini pada mulanya digunakan di bidang medis. Kemudian seiring berkembangnya waktu, analisis ini kemudian digunakan untuk memprediksi waktu churn dari customer perusahaan telekomunikasi. Analisis churn ini kemudian digunakan juga di perusahaan bidang lainnya dengan definisi churn yang berbeda. Salah satunya pada perusahaan dibidang retail. Pelanggan tersebut dikatakan churn ketika tidak melakukan traksaksi kembali dalam waktu tertentu. Data yang digunakan pada penelitian ini adalah data transaksi pelanggan Perusahaan XYZ pada periode 1 Januari 2021 sampai 31 Desember 2021 dengan rekam transaksi per hari yang berasal dari PT. Exorty Indonesia. Pada penelitian ini digunakan metode Random Survival Forest dan diperoleh model dengan nilai c-index sebesar 0.81.