Pengenalan Pembicara Dengan Mel Frequency Cepstrum Coefficient (MFCC) Sebagai Metode Ekstraksi Ciri Dan Jaringan Saraf Tiruan Propagasi Balik Sebagai Metode Pengenalan Pola
Abstract
Suara yang dimiliki setiap manusia mempunyai ciri khas tersendiri yang dapat dijadikan sebagai alat identifikasi. Identifikasi pembicara atau speaker recognition merupakan salah satu aplikasi dalam ranah Natural Language Processing yang merupakan suatu sistem untuk mengidentifikasi siapa yang berbicara. Penelitian dilakukan dengan merekam suara beberapa orang. Kemudian suara diolah dengan tahapan silence Elimination, dilanjutkan dengan ekstraksi ciri dengan metode Mel Frekuensi Cepstrum Coefisien (MFCC). Pemodelan menggunakan Back Propagation Neural Networks sebagai metode pengenalan pola. Dari penelitian yang telah dilakukan dapat disimpulkan bahwa Pemodelan penggunaan Back Propagation Neural Networks pada pengenalan speaker mempunyai akurasi sebesar 94,02% lebih baik dibandingkan dengan penggunaan Resilient Backpropagation sebesar 92,8% pada penelitian sebelumnya. Akurasi terbaik Back Propagation Neural Networks dengan 50 lapisan tersembunyi, perbandingan data test dan data train 60:40, dan overlap 40%. Pengujian dengan penambahan noise 30dB pada pengujian data akurasi meannya adalah 92,27%, noise 20dB pada data dengan akurasi rata-rata 73,55%, noise 10dB pada data dengan akurasi rata-rata 24% dan pada data dengan noise Akurasi rata-rata 5dB adalah 13,31%.
Collections
- UT - Computer Science [2254]