Praproses Data Teks Twitter pada Sistem Informasi Geografis untuk Kasus Pertanian di Indonesia
| dc.contributor.advisor | Adrianto, Hari Agung | |
| dc.contributor.author | Husnayain, Ihda | |
| dc.date.accessioned | 2024-03-28T04:52:55Z | |
| dc.date.available | 2024-03-28T04:52:55Z | |
| dc.date.issued | 2015 | |
| dc.identifier.uri | http://repository.ipb.ac.id/handle/123456789/144172 | |
| dc.description.abstract | Twitter merupakan salah satu jejaring sosial yang populer di kalangan pengguna internet saat ini. Hal ini menyebabkan cepatnya pertumbuhan data yang dihasilkan oleh Twitter. Sebagian besar data yang dihasilkan oleh Twitter berupa data teks. Data teks Twitter berisi informasi yang sangat luas terkait berbagai hal, bisa berupa fakta, peristiwa, perasaan, ataupun pandangan pribadi pengguna terhadap suatu hal, sehingga data teksnya masih banyak mengandung noise, katakata yang tidak bermakna, tidak terstruktur dan tidak baku. Penelitian ini bertujuan melakukan praproses data pada data teks Twitter dengan menerapkan metode text mining yang terdiri atas normalisasi teks dan seleksi fitur. Jumlah kata unik yang didapatkan dari hasil praproses pada data tweet dan data konten URL masing-masing sebanyak 84 kata dan 705 kata. Sedangkan persentase jumlah kata terkait pertanian untuk data tweet dan data konten URL masing-masing sebesar 48.80% dan 23.12%. Hasil praproses disajikan dalam bentuk term document matrix yang kemudian diubah ke dalam bentuk yang sesuai untuk penyimpanan data di MongoDB. Data tersebut selanjutnya dapat digunakan untuk analisis cluster dalam pembangunan sistem informasi geografis. | id |
| dc.language.iso | id | id |
| dc.publisher | IPB University | id |
| dc.subject.ddc | Computer sciences | id |
| dc.subject.ddc | Media | id |
| dc.title | Praproses Data Teks Twitter pada Sistem Informasi Geografis untuk Kasus Pertanian di Indonesia | id |
| dc.type | Undergraduate Thesis | id |
| dc.subject.keyword | data preprocessing | id |
| dc.subject.keyword | feature selection | id |
| dc.subject.keyword | text normalization | id |
| dc.subject.keyword | id | |
| dc.subject.keyword | Pemisahan datateks twitter | id |
| dc.subject.keyword | Penghapusan stop word | id |
| dc.subject.keyword | Stemming | id |
| dc.subject.keyword | Pembuatan TDM | id |
| dc.subject.keyword | Term document matrix | id |
Files in this item
This item appears in the following Collection(s)
-
UT - Computer Science [2482]

