Please use this identifier to cite or link to this item: http://repository.ipb.ac.id/handle/123456789/163251
Title: Fine-Tuning General-Purpose Text Embedding (GTE) Model untuk Pencarian Dokumen Akademik berbasis Semantik di Repository IPB University
Other Titles: 
Authors: Adisantoso, Julio
Mushthofa
Mashun, Hasrul Malik Putra
Issue Date: 2025
Publisher: IPB University
Abstract: Penelitian ini bertujuan untuk meningkatkan relevansi sistem pencarian dokumen akademik di Repository IPB University melalui fine-tuning model embedding GTE-Base-EN-v1.5. Dataset terdiri dari 122.977 dokumen, dengan 115.144 dokumen yang layak digunakan dan dikonversi ke format triplet menggunakan embedding OpenAI sebagai ground truth. Model dilatih menggunakan Multiple Negatives Ranking Loss pada 828.796 data latih dan 207.500 data validasi. Evaluasi terhadap 740 query dari 37 departemen menunjukkan peningkatan signifikan. Pada Top-5, MRR meningkat dari 0.1049 menjadi 0.3938, Precision dari 0.0451 menjadi 0.1849, dan Accuracy dari 0.1554 menjadi 0.5743. Loss juga menurun dari 0.0402 menjadi 0.0047, menandakan proses pelatihan efektif tanpa overfitting. Model hasil fine-tuning mencapai accuracy 0.6730 pada Top-10, jauh lebih baik dibandingkan sebelum pelatihan (0.2257).
URI: http://repository.ipb.ac.id/handle/123456789/163251
Appears in Collections:UT - Computer Science

Files in This Item:
File Description SizeFormat 
cover_G6401201064_11726746944041a9aa50dca8fba18145.pdfCover583.07 kBAdobe PDFView/Open
fulltext_G6401201064_c6d41dfd90ce44c884987ed9530144d0.pdf
  Restricted Access
Fulltext1.42 MBAdobe PDFView/Open
lampiran_G6401201064_cee28c5e4c534bf983c202879c1bbe3a.pdf
  Restricted Access
Lampiran184.05 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.