Model Klasifikasi Berita Olahraga Berdasarkan Data Altmetrics menggunakan Algoritme Pohon Keputusan C5.0
Abstract
Pemanfaatan teknologi untuk menerbitkan suatu berita dapat memudahkan
masyarakat untuk mendapatkan informasi. Website suatu berita olahraga
memberikan berbagai macam berita dengan berbagai jenis cabang olahraga.
Penelitian ini bertujuan membuat model klasifikasi berita olahraga menggunakan
data altmetrics untuk suatu situs berita olahraga. Algoritme yang digunakan dalam
klasifikasi adalah C5.0 dengan model klasifikasi berbasis pohon dan berbasis aturan.
Tahap klasifikasi diawali dengan memilih kelas target dan atribut karakteristik
berita untuk membentuk model. Setelah itu melakukan preprocessing data untuk
menghilangkan missing value dengan cara memberikan nilai rataan dari setiap
atribut yang memiliki kelas target yang sama. Evaluasi model dilakukan
menggunakan 10 fold cross validation. Model klasifikasi yang dihasilkan adalah
sebuah pohon keputusan yang terdiri atas 295 nodes dengan akurasi tertinggi
95.39%. Penggunaan atribut terbanyak adalah kunjungan yang berasal dari link
pada timeline Twitter. Model berbasis aturan memiliki 122 rules dengan akurasi
tertinggi 97.11%. Atribut yang memiliki nilai penggunaan terbanyak dalam model
berbasis aturan adalah Direct ref yaitu kunjungan yang dari orang yang mencari
langsung alamat situs web pada browser.
Collections
- UT - Computer Science [2322]