Metode Pencarian dan Temu-Kembali Nama Berdasarkan Kesamaan Fonetik
Abstract
Sistem temu-kembali informasi membandingkan query pengguna pada dokmnen-dokumen yang disimpan dalam berkas basis data. Beberapa pendekatan pembentukan turunan query telab dikembangkan untuk mengatasi ketidak jelasan akar kata yang akan dicari, salab satunya adalah dengan ukuran kesamaan fonetik. Ada beberapa algoritme dengan menggunakan pendekatan ini, yaitu Soundex dan Phonix yang dikembangkan berdasarkan kesamaan bunyi dalarn bahasa Inggris. Pada penelitian ini akan dibuktikan bahwa algoritme Phonix4 dan PhonixE memiliki kinerja yang lebih baik bila dibandingkan dengan algoritme Phonix8 dan Soundex. Hal ini terjadi karena kesederbanaan algoritme Phonix4 dan PhonixE, dimana kode filtering yang dibentuk tidak terlalu panjang dan penggolongan konsonan yang tidak terlalu sedikit. Akibatnya nilai precision menjadi tinggi, sedangkan tingkat recall-nya rendah. Selain kode yang biasa dipakai pada metode lainnya, PhonixE juga mempunyai kode untuk bunyi akhir sebanyak empat karakter. Tingkat recall yang dapat dipakai pada sistem temu-kembali informasi dengan metode Soundex dan Phonix8 adalab 0.2, sedangkan pada metode Phonix4 dan PhonixE adalah 0.1. AIgoritme Soundex dan Phonix walaupun dikembangkan untuk bahasa Inggris, temyata dapat bekerja dengan baik pada bahasa Indonesia. Hal tersebut karena bahasa Inggris dan Indonesia menggolongkan konsonan-konsonannya dengan keistimewaan-keistimewaan yang sarna.
Collections
- UT - Computer Science [2324]