Pengaruh Boruta, ReliefF, dan RFECV dalam Klasifikasi Kanker Payudara Berdasarkan Data Microarray
Abstract
Kanker adalah penyakit mematikan akibat pertumbuhan sel abnormal yang tak terkendali, dan kanker payudara merupakan jenis yang paling umum di Indonesia dengan berbagai subtype. Penelitian ini mengklasifikasi subtype kanker payudara menggunakan data microarray dan machine learning, mengingat data microarray menghasilkan Data dimensi tinggi yang rentan terhadap overfitting. Untuk mengatasi masalah ini, digunakan tiga algoritma feature selection: ReliefF, RFECV, dan Boruta. Hasil penelitian menunjukkan bahwa Boruta memberikan performa terbaik pada beberapa model, dengan akurasi tertinggi pada model KNN (0,967) dan SVM (0,987). Relief juga memberikan peningkatan akurasi yang signifikan, terutama pada model SVM dengan akurasi sebesar 0,987, sedangkan RFECV mencatat akurasi terbaik pada model Decision Tree (0,821). Selain performa, Boruta mencatat runtime tercepat (603 detik) dengan 901 fitur terseleksi. Hasil ini menjadikan Boruta pilihan unggul untuk klasifikasi