Text mining Dokumen Skripsi berdasarkan Abstrak dengan Menggunakan Metode Gerombol Berhirarki dan Latent Dirichlet Allocation.
View/ Open
Date
2016Author
Nugraha, Muhammad Fauzan Setya
Soleh, Agus M
Anisa, Rahma
Metadata
Show full item recordAbstract
Abstrak merupakan ringkasan dari suatu karya ilmiah yang menggambarkan isi dari suatu karya ilmiah seperti skripsi. Pengelompokan skripsi berdasarkan abstraknya ke dalam kategori-kategori salah satunya dapat menggunakan text mining. Text mining merupakan salah satu variasi dari data mining, yaitu menggali pola atau informasi penting dari data berupa teks. Penelitian ini menggunakan analisis gerombol berhirarki untuk mendapatkan gerombol-gerombol yang dihasilkan dari data teks. Analisis gerombol berhirarki yang dilakukan menggunakan metode Ward dan metode pautan lengkap serta menggunakan ukuran cosine similarity untuk mengukur jarak antar vektor dokumen. Gerombol yang dihasilkan ditentukan oleh hasil pemotongan dendogram dengan melihat nilai silhouette coefficient yang paling besar. Gerombol yang dihasilkan dari keseluruhan data diperoleh sebanyak 12 gerombol. Karakteristik masing-masing gerombol berupa kata-kata yang merupakan kata kunci atau topik dari dokumen yang termasuk dari gerombol tersebut. Metode Latent Dirichlet Allocation mengambil kata-kata dari keseluruhan kata pada dokumen yang bisa menjadi topik-topik dari 12 gerombol tersebut.