Clustering Data Teks Twitter Untuk Kasus Pertanian Di Indonesia
View/ Open
Date
2015Author
Denatari, Ryan Budiman
Adrianto, Hari Agung
Metadata
Show full item recordAbstract
Mayoritas pengguna internet di Indonesia mengakses media sosial. Hal tersebut menyebabkan masyarakat dapat memperoleh informasi dan menyebarkannya dengan lebih cepat. Informasi yang beredar melalui media sosial sangat beragam, termasuk di dalamnya topik pertanian. Hal ini dapat dimanfaatkan untuk menganalisis kasus pertanian di Indonesia, dengan melakukan clustering data teks Twitter untuk kasus pertanian di Indonesia. Data yang digunakan yaitu data teks Twitter berjumlah 102 data. Data teks Twitter terbagi menjadi 2 jenis, yaitu data tweet sejumlah 51 data dan data konten uniform resource locator sejumlah 51 data. Kedua jenis data tersebut dibandingkan dan dikelompokkan dengan algoritme hierarchical clustering untuk mendapatkan cluster terbaik. Data teks tersebut diukur kemiripannya dengan metode cosine similarity. Hasil cluster terbaik yang diperoleh yaitu jenis data konten uniform resource locator pada complete linkage yang terbagi ke dalam 12 cluster, dengan nilai sum of squared error 0.1499 pada ketinggian 0.032. Data konten uniform resource locator lebih baik karena memiliki jumlah term yang lebih banyak sehingga lebih merepresentasikan isi topik dari data. Jumlah data konten uniform resource locator yang diberi label berjumlah 50 data yang terbagi ke dalam 11 cluster.
Collections
- UT - Computer Science [2330]