Please use this identifier to cite or link to this item:
http://repository.ipb.ac.id/handle/123456789/163251| Title: | Fine-Tuning General-Purpose Text Embedding (GTE) Model untuk Pencarian Dokumen Akademik berbasis Semantik di Repository IPB University |
| Other Titles: | |
| Authors: | Adisantoso, Julio Mushthofa Mashun, Hasrul Malik Putra |
| Issue Date: | 2025 |
| Publisher: | IPB University |
| Abstract: | Penelitian ini bertujuan untuk meningkatkan relevansi sistem pencarian dokumen akademik di Repository IPB University melalui fine-tuning model embedding GTE-Base-EN-v1.5. Dataset terdiri dari 122.977 dokumen, dengan 115.144 dokumen yang layak digunakan dan dikonversi ke format triplet menggunakan embedding OpenAI sebagai ground truth. Model dilatih menggunakan Multiple Negatives Ranking Loss pada 828.796 data latih dan 207.500 data validasi. Evaluasi terhadap 740 query dari 37 departemen menunjukkan peningkatan signifikan. Pada Top-5, MRR meningkat dari 0.1049 menjadi 0.3938, Precision dari 0.0451 menjadi 0.1849, dan Accuracy dari 0.1554 menjadi 0.5743. Loss juga menurun dari 0.0402 menjadi 0.0047, menandakan proses pelatihan efektif tanpa overfitting. Model hasil fine-tuning mencapai accuracy 0.6730 pada Top-10, jauh lebih baik dibandingkan sebelum pelatihan (0.2257). |
| URI: | http://repository.ipb.ac.id/handle/123456789/163251 |
| Appears in Collections: | UT - Computer Science |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| cover_G6401201064_11726746944041a9aa50dca8fba18145.pdf | Cover | 583.07 kB | Adobe PDF | View/Open |
| fulltext_G6401201064_c6d41dfd90ce44c884987ed9530144d0.pdf Restricted Access | Fulltext | 1.42 MB | Adobe PDF | View/Open |
| lampiran_G6401201064_cee28c5e4c534bf983c202879c1bbe3a.pdf Restricted Access | Lampiran | 184.05 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.