Clustering Dan Geovisualisasi Data Teks Twitter Dengan Algoritme K-Means Untuk Kasus Kebakaran Hutan Dan Bencana Alam
Abstract
Twitter merupakan microblogging yang mampu menyebarkan informasi penting pada masyarakat pengguna internet. Twitter memiliki fitur tweet yang berisi data teks, longitude, latitude, dan lain-lain. Penelitian ini bertujuan untuk melakukan clustering dengan algoritme K-Means pada data teks Twitter terkait isu kebakaran hutan dan bencana alam di Indonesia. Data penelitian ini berupa data tweet yang dikumpulkan berdasarkan hashtag tentang kebakaran hutan dan bencana alam. Penelitian ini juga menyajikan hasil clustering data teks Twitter dengan geovisualisasi yang direpresentasikan pada peta. Algoritme K-Means berhasil diimplementasikan pada Term Document Matrix dari praproses data Teks Twitter dengan pemograman R. Proses geovisualisasi berhasil diimplementasikan pada data Twitter dengan framework R Shiny. Hasil implementasi algoritme K-Means pada data teks Twitter menggunakan nilai k sebesar 7 dan nilai sum squared error (SSE) yang dihasilkan 5693.169. Geovisualisasi hasil clustering data teks Twitter menyebar di seluruh Indonesia berdasarkan longitude dan latitude tiap data tweet tersebut. Tidak semua kategori bencana membentuk cluster sendiri, melainkan masuk pada cluster yang dominan.
Collections
- UT - Computer Science [2322]