Show simple item record

dc.contributor.advisorWijaya, Sony Hartono
dc.contributor.authorRasendriya, Muhamad Hadziq Firza
dc.date.accessioned2024-08-05T14:20:19Z
dc.date.available2024-08-05T14:20:19Z
dc.date.issued2024
dc.identifier.urihttp://repository.ipb.ac.id/handle/123456789/155742
dc.description.abstractDengan setiap pakar memiliki keahlian yang berbeda, dan keahlian ini dapat diidentifikasi melalui dokumen-dokumen yang paling menunjukkan kemampuannya. Sebuah model klasterisasi diperlukan untuk mengklasifikasikan karya ilmiah secara otomatis ke dalam domain keahlian yang berbeda. Dengan adanya pengelompokan ini menjadi salah satu cara untuk mengklaim atau memvalidasi dari bidang kepakaran seseorang. Penelitian ini menggunakan algoritma Latent Dirichlet Allocation (LDA) untuk mengurangi dimensi data dan menggunakan metode Agglomerative Hierarchical Clustering yang ditingkatkan dengan dan T-distributed Stochastic Neighbor Embedding (T-SNE) sebagai klasterisasi dokumen publikasi ilmiahnya. Temuan penelitian ini secara efektif mengelompokkan dokumen, yang dibuktikan dengan nilai koefisien silhouette sebesar 0.544 dengan nilai yang lebih tinggi menunjukkan klaster yang lebih baik. Model yang dibangun dievaluasi dengan membandingkan cluster yang dihasilkan dengan klaim yang dinyatakan. Hasilnya, 25% hasil pencocokan tidak sesuai dan 75% sesuai.
dc.description.abstractEach expert has different expertise, and this expertise can be identified through the documents that best demonstrate his or her skills. A clustering model is needed to automatically classify scientific papers into different domains of expertise. This clustering is one way to claim or validate one's area of expertise. This research uses the Latent Dirichlet Allocation (LDA) algorithm to reduce the dimensionality of the data and uses the Agglomerative Hierarchical Clustering method enhanced with and T-distributed Stochastic Neighbor Embedding (T-SNE) as its clustering of scientific publication documents. The findings of this study effectively cluster the documents, as evidenced by the silhouette coefficient value of 0.544 with higher values indicating better clusters. The built model was evaluated by comparing the resulting clusters with the stated claims. As a result, 25% of the matching results did not match and 75% matched.
dc.description.sponsorship
dc.language.isoid
dc.publisherIPB Universityid
dc.titlePengelompokan Dokumen Publikasi Ilmiah Berdasarkan Bidang Kepakaran Menggunakan Metode Agglomerative Hierarchical Clusteringid
dc.title.alternativeGrouping Scientific Publication Documents Based on Field of Expertise Using Agglomerative Hierarchical Clustering Method
dc.typeSkripsi
dc.subject.keywordclusteringid
dc.subject.keywordldaid
dc.subject.keywordt-SNEid
dc.subject.keyworddokumenid
dc.subject.keywordklasterisasiid
dc.subject.keywordagglomerative hierarchical clusteringid
dc.subject.keyworddocumentsid


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record