Peranan substitusi N-Grams dan code shift pada algoritma soundex
View/ Open
Date
2006Author
Arifin F S., R Zainal
Nurdiati, Sri
Adisantoso, Julio
Metadata
Show full item recordAbstract
Ketidakjelasan akar kata akibat keterbatasan pengetahuan informasi pengguna mengenai nama ilmiah dan sifat temu-kembali nama ilmiah yang hanya memiliki dua kemungkinan hasil temu kembali, yaitu ditemu-kembalikan semua atau tidak ditemu-kembalikan sama sekali, menyebabkan sistem temukembali kesamaan fonetik untuk nama ilmiah memiliki kinerja yang rendah. Tujuan penelitian ini adalah mengukur kinerja n-grams substitution dan code shift dalam upaya meningkatkan nilai recall dan precision algoritma Soundex. Tercakup di dalamnya proses pembentukan kamus kata nama ilmiah, identifikasi nama ilmiah dalam dokumen, dan proses perangkingan dengan menggunakan dice coefficient. Pengujian menggunakan koleksi dokumen sebanyak 849 dokumen dan 20 jenis query dengan jenis kesalahan yang berbeda. Kinerja temu-kembali dibandingkan antara tidak menggunakan substitusi ngrams dan code shift, hanya menggunakan substitusi n-grams (NS), dan menggunakan substitusi n-grams dan code shift (CS). Hasil penelitian mengungkapkan bahwa kinerja substitusi n-grams dan code shift mampu meningkatkan kinerja sistem temu-kembali kesamaan fonetik untuk nama ilmiah. Kedua teknik tersebut mampu 95% menemu-kembalikan nama ilmiah dengan contoh 20 querypengujian tersebut.
Hasil penelitian juga mengungkapkan bahwa data tidak berpengaruh terhadap bahasa ketika ditambahkan substitusi n-grams dan code shift. Hal ini karena substitusi n-grams melakukan penyeragaman terhadap perubahan bunyi akibat pertemuan antara dua alfabet atau lebih ke dalam satu alfabet atau lebih.
Collections
- UT - Computer Science [2482]
