Evaluasi Penainbahan Dokumen dalam Sistem Temu Kembali Informasi
View/ Open
Date
2005-10Author
Adisantoso, Julio
Herdiyeni', Yeni
Kartika-, Ika
Metadata
Show full item recordAbstract
Saat ini pengguna cenderung menyukai pencarian berdasarkan makna. Hal ini disebabkan oleh adanya masalah sinonim dan polisemi dalam pemilihan penggunaan kata. Salah satu teknik yang mencoba mengatasi masalah tersebut Latent Semantic Indexing (LSI). Dalam pengaplikasiannya. LS! dapat menggunakan Singular Value Decomposition untuk mengestimasi struktur penggunaan kata dalam dokumen. Cara yang paling tepat untuk menambohkan dokumen atau istilah adalah melalui penghitungan ulang SVD (recomputing SVD). Namun hal tni menjadi kendala karena dibutuhkannya memory yang cukup besar dan waktu yang semakin lama untuk menghitung ulang matriks istilah-dokumen yang semakin besar. Cara lain yang dapat digunakan untuk mengatasi kendala tesebut adaloh dengan menggunakan teknik folding-in. Tujuan penelitian ini adalah untuk melihat pengaruh penambahan dokumen terhadap hubungan tersembunyi antara semua istilah yang secara kontekstual berdekatan artinya dengan menggunakan teknik folding-in. Tercakup didalamnya proses pembentukan matriks istilah-dokumen dengan menggunakan parsing. penghilangan stop list. serta stemming. Pembobotan istilah untuk dokumen menggunakan skema pembobotan lxn. sedangkan pembobotan istilah untuk kuen menggunakan skema pembobotan eft. Pengujian menggunakan 150 dokumen untuk membangkitkan matriks istilahdokumen asal dan 110 dokumen untuk evaluasi penambahan dokumen. Pengukuran kinerja temu kembali dilakukan dengan menggunakan average precision untuk mengetahui rank optimal terhadap sepuluh kueri. Temyata pada penelitian ini dengan pemilihan rank yang kecil akan memberikan hasil dengan tingkat akurasi yang cukup tinggi dengan tertanganinya masalah sinonim. Penambahan dokumen dengan folding-in memberikan hasil yang memuaskan. Melalui penambahan 110 dokumen ke dalam koleksi sebogian besar nilai recall bisa dipertahankan apabila menggunakan rank yang kecil. meskipun terdapat distorsi seiring dengan penambahan dokumen.
Collections
- Computer Science [72]