Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/128760
Title: Text mining Dokumen Skripsi berdasarkan Abstrak dengan Menggunakan Metode Gerombol Berhirarki dan Latent Dirichlet Allocation.
Other Titles: Text mining Dokumen Skripsi berdasarkan Abstrak dengan Menggunakan Metode Gerombol Berhirarki dan Latent Dirichlet Allocation
Authors: Soleh, Agus M
Anisa, Rahma
Nugraha, Muhammad Fauzan Setya
Issue Date: 2016
Publisher: IPB (Institut Pertanian Bogor)
Abstract: Abstrak merupakan ringkasan dari suatu karya ilmiah yang menggambarkan isi dari suatu karya ilmiah seperti skripsi. Pengelompokan skripsi berdasarkan abstraknya ke dalam kategori-kategori salah satunya dapat menggunakan text mining. Text mining merupakan salah satu variasi dari data mining, yaitu menggali pola atau informasi penting dari data berupa teks. Penelitian ini menggunakan analisis gerombol berhirarki untuk mendapatkan gerombol-gerombol yang dihasilkan dari data teks. Analisis gerombol berhirarki yang dilakukan menggunakan metode Ward dan metode pautan lengkap serta menggunakan ukuran cosine similarity untuk mengukur jarak antar vektor dokumen. Gerombol yang dihasilkan ditentukan oleh hasil pemotongan dendogram dengan melihat nilai silhouette coefficient yang paling besar. Gerombol yang dihasilkan dari keseluruhan data diperoleh sebanyak 12 gerombol. Karakteristik masing-masing gerombol berupa kata-kata yang merupakan kata kunci atau topik dari dokumen yang termasuk dari gerombol tersebut. Metode Latent Dirichlet Allocation mengambil kata-kata dari keseluruhan kata pada dokumen yang bisa menjadi topik-topik dari 12 gerombol tersebut.
URI: http://repository.ipb.ac.id/handle/123456789/128760
Appears in Collections:UT - Statistics and Data Sciences

Files in This Item:
File Description SizeFormat 
G16mfs.pdf
  Restricted Access
Full Teks984.47 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.