Evaluasi Stemmer Berbasis Bahasa Indonesia dengan dan tanpa Menggunakan Kamus Kata Dasar
View/ Open
Date
2005Author
Wandari, Farid Aries
Ridha, Ahmad
Adisantoso, Julio
Metadata
Show full item recordAbstract
Dengan mengabaikan kasus homonim dan polisemi, kata-kata yang memiliki kata dasar yang sama memiliki makna yang sama. (Achmadi, 2002). Misalkan kata bermain, mainkan, memainkan, mempermainkan. Jika seluruh imbuhan dihilangkan, maka akan diperoleh akar kata yang sama, yaitu kata dasar main. Penghilangan imbuhan dapat dilakukan untuk memotong variasi kata turunan sehingga diperoleh kata dasarnya, ataupun untuk sekadar mengelompokkan kata berdasarkan kesamaan semantik katanya.
Meskipun proses pemotongan imbuhan (stemming) dapat dibuat tanpa melihat aspek ketatabahasaan, stemmer yang mampu memperoleh kata dasar dari kata turunannya dapat dikatakan sebagai stemmer yang baik Hal ini karena stemmer tersebut mampu mengelompokkan kata-kata dengan grup semantik yang sama (yaitu kata-kata dengan kata dasar yang sama) ke dalam grup stem yang sama. Namun karena kompleksitas kata-kata yang ada dalam suatu bahasa, kesalahan pemotongan dapat saja terjadi, bahkan pada stemmer yang menggunakan kamus kata dasar sekalipun.
Beberapa penelitian sebelumnya tentang proses stemming di antaranya pernah dilakukan oleh Siregar (1995) dan Nazief (1996) dengan menggunakan kamus kata dasar, Ridha (2002) dan Tala (2003) tanpa menggunakan kamus kata dasar. Nazief (1996) dan Tala (2003) telah mengembangkan stemmer yang disertai aturan pasangan prefiks sufiks yang terlarang. Sedangkan Ridha (2002) mengembangkan stemmer yang disertai teknik pengubahan stem.
Penelitian ini mencoba menggabungkan beberapa metode yang telah dilakukan dalam penelitian sebelumnya, baik tanpa atau dengan menggunakan kamus kata dasar. ...
Collections
- UT - Computer Science [2482]
