Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/128760
Title: | Text mining Dokumen Skripsi berdasarkan Abstrak dengan Menggunakan Metode Gerombol Berhirarki dan Latent Dirichlet Allocation. |
Other Titles: | Text mining Dokumen Skripsi berdasarkan Abstrak dengan Menggunakan Metode Gerombol Berhirarki dan Latent Dirichlet Allocation |
Authors: | Soleh, Agus M Anisa, Rahma Nugraha, Muhammad Fauzan Setya |
Issue Date: | 2016 |
Publisher: | IPB (Institut Pertanian Bogor) |
Abstract: | Abstrak merupakan ringkasan dari suatu karya ilmiah yang menggambarkan isi dari suatu karya ilmiah seperti skripsi. Pengelompokan skripsi berdasarkan abstraknya ke dalam kategori-kategori salah satunya dapat menggunakan text mining. Text mining merupakan salah satu variasi dari data mining, yaitu menggali pola atau informasi penting dari data berupa teks. Penelitian ini menggunakan analisis gerombol berhirarki untuk mendapatkan gerombol-gerombol yang dihasilkan dari data teks. Analisis gerombol berhirarki yang dilakukan menggunakan metode Ward dan metode pautan lengkap serta menggunakan ukuran cosine similarity untuk mengukur jarak antar vektor dokumen. Gerombol yang dihasilkan ditentukan oleh hasil pemotongan dendogram dengan melihat nilai silhouette coefficient yang paling besar. Gerombol yang dihasilkan dari keseluruhan data diperoleh sebanyak 12 gerombol. Karakteristik masing-masing gerombol berupa kata-kata yang merupakan kata kunci atau topik dari dokumen yang termasuk dari gerombol tersebut. Metode Latent Dirichlet Allocation mengambil kata-kata dari keseluruhan kata pada dokumen yang bisa menjadi topik-topik dari 12 gerombol tersebut. |
URI: | http://repository.ipb.ac.id/handle/123456789/128760 |
Appears in Collections: | UT - Statistics and Data Sciences |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
G16mfs.pdf Restricted Access | Full Teks | 984.47 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.