| dc.description.abstract | Sistem temu-kembali informasi membandingkan query pengguna pada dokumen-dokumen yang disimpan dalam berkas basis data. Beberapa pendekatan pembentukan turunan query telah dikembangkan untuk mengatasi ketidakjelasan akar kata yang akan dicari, salah satunya adalah dengan ukuran kesamaan fonetik. Ada beberapa algoritme dengan menggunakan pendekatan ini, yaitu Soundex dan Phonix yang dikembangkan berdasarkan kesamaan bunyi dalam bahasa Inggris.
Pada penelitian ini akan dibuktikan bahwa algoritme Phonix4 dan PhonixE memiliki kinerja yang lebih baik bila dibandingkan dengan algoritme Phonix8 dan Soundex. Hal ini terjadi karena kesederhanaan algoritme Phonix4 dan PhonixE, dimana kode filtering yang dibentuk tidak terlalu panjang dan penggolongan konsonan yang tidak terlalu sedikit. Akibatnya nilai precision menjadi tinggi, sedangkan tingkat recall-nya rendah. Selain kode yang biasa dipakai pada metode lainnya, PhonixE juga mempunyai kode untuk bunyi akhir sebanyak empat karakter. Tingkat recall yang dapat dipakai pada sistem temu-kembali informasi dengan metode Soundex dan Phonix8 adalah 0.2, sedangkan pada metode Phonix4 dan PhonixE adalah 0.1.
Algoritme Soundex dan Phonix walaupun dikembangkan untuk bahasa Inggris, ternyata dapat bekerja dengan baik pada bahasa Indonesia. Hal tersebut karena bahasa Inggris dan Indonesia menggolongkan konsonan-konsonannya dengan keistimewaan-keistimewaan yang sama. | id |