Penerapan mel-frequency cepstrum coefficients (mfcc) sebagai ekstraksi ciri pada transkripsi suara ke teks dengan self organizing maps (som)
Abstract
Transkripsi suara ke teks adalah suatu teknik yang memungkinkan sebuah komputer untuk menerima input berupa kata yang diucapkan dan ditranskripsikan ke dalam sebuah teks. Tujuan penelitian ini adalah mengembangkan suatu sistem transkripsi suara ke teks dengan ekstraksi ciri mfcc dan pemodelan jaringan syaraf tiruan self organizing maps (som). Data yang digunakan adalah data suara yang telah direkam dari satu pembicara yang mengucapkan 15 kata untuk data latih dan 5 kata untuk data uji. Masing-masing kata diulang hingga mencapai 240 data latih dan 50 data uji. Kemudian ciri data suara diekstraksi dengan sampling rate 11000 hz, time frame 23.27 ms, overlap 0.39 ms, dan koefisien cepstral 13 untuk mendapatkan karakteristik dari sinyal suara dalam setiap frame. Percobaan dilakukan dengan mengenali tiap suku kata yang ada pada data uji. Hasil menunjukkan bahwa akurasi tertinggi yang diperoleh sebesar 95% pada kombinasi parameter epoch 10, 30, 50, 70, 90 dan 110, learning rate sebesar 0.5, penurunan learning rate 0.999, dan radius 0
Collections
- UT - Computer Science [2322]