Kajian Kinerja Algoritme Klasifikasi Extra-Trees pada Permasalahan Data Kelas Tak Seimbang
Abstract
Kelas tak seimbang merupakan kondisi apabila suatu kelas atau kategori memiliki frekuensi yang jauh lebih banyak daripada kelas lainnya. Kondisi seperti ini dapat menyebabkan algoritme terbiaskan oleh kelas mayor yaitu kelas yang frekuensinya lebih banyak, sehingga kinerjanya menjadi sangat buruk dalam memprediksi kelas minor. Salah satu strategi untuk mengatasi kelas tak seimbang adalah dengan cara penyesuain parameter-parameter algoritme, misalnya penyesuaian cara penentuan pembuatan daun (leaf) saat menggunakan algoritme berbasis pohon klasifikasi. Selain itu, dapat pula dilakukan pemilihan dari beberapa algoritme untuk menemukan model yang paling cocok.
Masalah kelas tak seimbang dapat ditemui pada kasus stock market crash, karena kasus tersebut terbilang sangat jarang terjadi. Bagi akademisi dan praktisi, kehancuran pasar saham atau stock market crash merupakan hal yang penting. Efek dari satu stock market crash akan lebih besar dan semakin besar lagi, sehingga pada akhirnya bisa menyebabkan efek domino (global). Stock market crash sangat jarang terjadi tetapi sering kali menimbulkan dampak yang besar saat terjadi. Oleh karena itu penelitian dilakukan untuk mengecilkan potensi dan dampak dari stock market crash. Salah satu caranya yaitu dengan memprediksi terjadinya crash.
Beberapa algoritme klasifikasi yang sudah sering digunakan diantaranya adalah Pohon Tunggal, Adaptive Boosting, dan Random Forest. Algoritme klasifikasi lain yang juga dapat digunakan adalah Extra-Trees. Algoritme ini serupa dengan Random Forest yang membangun banyak pohon dan membagi simpul menggunakan subset atribut acak, namun pada Extra-Trees keacakan tidak berasal dari bootstrap data, melainkan berasal dari pemisahan acak dari semua pengamatan. Extra-Trees memiliki keunggulan dalam segi waktu dibandingkan dengan Random Forest dan algoritme berbasis pohon lainnya.
Penelitian ini dilakukan untuk membandingkan kinerja algoritme Extra-Trees dengan algoritme Pohon Tunggal, Random Forest, dan Adaptive Boosting pada kasus data class imbalance, kemudian menerapkan algortime Extra-Trees pada data stock market crash tahun 2010 hingga 2020.
Hasil penelitian ini menunjukkan bahwa ensemble learning memiliki kinerja algoritme yang lebih baik daripada pohon tunggal. Di antara algoritme ensemble learning yang digunakan, Extra-Trees cenderung menunjukkan hasil yang lebih stabil dan kinerja yang lebih baik daripada Adaptive Boosting ataupun Random Forest. Pada data stock market crash dengan menggunakan algoritme Extra-Trees, diperoleh nilai sensitivitas sebesar 45,45%.