Pengenalan Kata Berbahasa Indonesia dengan Menggunakan Hidden Markov Models Berbasiskan Fonem

Pengenalan kata (speech recognition) adalah suatu proses dimana komputer dapat mengidentifikasi kala-kala yang diucapkan. Dalam hal ini berarti suatu sistem pengenal kata mendapat masukan berupa sinyal suara kemudian mengubahnya ke dalam bentuk tulisan (Iext) kata atau kalimat yang sesuai dengan sinyal suara yang diucapkan. Selama ini penelitian yang dilakukan pada bidang pengenalan kata cenderung berbasiskan kala, yang mana setiap kata yang terdapat dalam kamus kata dimodelkan dengan sebuah hidden markov models (HMM). Hal ini mengakibatkan kurang efektifnya sistem apabila akan dikembangkan untuk sistem pengenalan kata yang bersifat large vocabulary yang mana kata yang terdapat dalam kamus kata berjumlah sangat besar. Oleh karena itu, pada penelitian ini akan dikembangkan suatu sistem pengenalan kata y;mg bertmsiskan f9ne!11, Yang mana uowk semua I<ata yang terdapal <;ialam Iqprms kata akan dimodelkan ke dalam satu buah HMM. Penelitian ini menggunakan algoritme Baum Welch untuk pelatihan, algoritme Viterbi untuk pengujian, serta menggunakan Mel-Frequency Cepstral Coeffisient (MFCC) sebagai ekstraksi cirinya. Data yang digunakan dalam penelitian ini adalah kata yang berbahasa Indonesia yang berjumlah 15 kata. Masing-masing kata diulang to kali ulangan dengan rincian 7 kali ulangan sebagai data latih dan 3 kali ulangan sebagai data uji. Selain itu jumlah koefisien yang digunakan ct!llam proses ekstraksi ciri dengan menggunakan MFCC yaitu sebesar 13 dan 26 koefisien, Penelitian ini masih memiliki Iingkup yang kecH yaitu bersifat small vocabulary, speaker dependent, isolated word dan penelitian difokuskan pada proses pemodelan kata. Bersifat sma/[ vocabulary karena kata yang digunakan banya beIjumlah kurang dari 1000 kata yaitu sebesar 15 kala. Bersifat speaker dependent karena pengujian hanya dilakukan kepada pembicara yang telah dilatih sebelumnya, dan bersifat isolated word karena sistem hanya dapat mengenali kata yang terpisah dengan kata lainnya (bukan suatu kalimat). Penelitian ini mengbasilkan 2 buah HMM yang terdiri dari 1 buah HMM yang terbentnk dengan menggunakan 13 koefisien cepstral, dan I buah HMM yang terbentuk dengan menggunakan 26 koefisien cepstral. Selain itu hasil dari penelitian ini menunjukkan bahwa penggunaan 13 koefisien pada saat proses ekstraksi eiri memiliki tingkat akurasi yang lebih baik jika dibandingkan dengan penggullaan 26 koefisien. Rataan error rate yang dipero1eh Wltuk ekstraksi ciri dengan 13 koefisien adalah sebesar 11,5% untuk data latih dan 31 % untuk data uji. Rataan error r{lle pada sistem dengan 26 koefisien adalah sebesar 26,3% untuk data latih dan 35,5% untuk data uji. Dari kedua HMM tersebut memiliki kesamaan kata yang mudah untuk dikenali dan yang sukar untuk dikenali. Kata yang sukar untuk dikenali adalah kala nenek, padi dan pintu dengan rataan error rate sebesar 80% untuk kata ncnck, 70,8% untuk kata padi dan 66,7% untuk kata pintu. Kala yang mudah dikenali adalah kala ukir dengan rataan error rate sebesar 0%. Selain itu kesalahan pengenalan suatu fonem disebabkan oleh kesamaan karakteristik yang dimiliki antara fonem satu dengan fonem yang lainnya, sedangkan letak fonem dalam suatu kata tidak berpengaruh terhadap error rate yang dihasilkan.

URI

http://repository.ipb.ac.id/handle/123456789/60211

Collections

UT - Computer Science [2482]