Penerapan N-gram dan Multi Minimum Support untuk Asosiasi Data Tweet Kebakaran Hutan dengan Data Cuaca dan Data Sosial Ekonomi.
Abstract
Penelitian mengenai asosiasi data tweet dengan data cuaca dan data sosial
ekonomi sudah dilakukan sebelumnya. Penelitian sebelumnya menggunakan single
minimum support. Penggunaan single minimum support tidak efektif karena setiap
item memiliki frekuensi kemunculan yang berbeda. Oleh karena itu, penelitian ini
menggunakan multi minimum support. Penelitian ini juga menggunakan fitur Ngram
untuk mendapatkan frase kata yang sering muncul bersama. Metode
association rule mining yang digunakan adalah algoritme multi minimum support
Apriori dengan kombinasi nilai support. Nilai minimum support yang digunakan
pada data tweet adalah 5, 10, 15, dan 20, sedangkan nilai minimum support yang
digunakan pada data cuaca dan data sosial ekonomi adalah 55, 60, 65, dan 70. Nilai
minimum confidence yang digunakan adalah 75. Jumlah aturan yang dihasilkan
adalah 80 aturan, 41 aturan merupakan hasil asosiasi data cuaca, sedangkan 39
aturan lainnya merupakan hasil asosiasi data sosial ekonomi. Jumlah aturan yang
didapat pada penelitian ini lebih sedikit dibandingkan dengan penelitian
sebelumnya. Namun, menghasilkan aturan yang lebih spesifik.
Collections
- UT - Computer Science [2322]