Identifikasi Pembicara dengan MFCC sebagai Ekstraksi Ciri dan Codebook untuk Pengenalan Pola
Abstract
Setiap orang mempunyai karakteristik suara yang berbeda-beda. Penelitian ini mengembangkan pembicara
sistem yang menggunakan suara manusia sebagai fiturnya. Model ini menggunakan metode yang bergantung pada teks. Pembicara
identifikasi memiliki masalah kompleks yang disebabkan oleh frasa yang salah diucapkan atau salah dibaca, mikrofon yang berbeda
penempatan, gangguan latar belakang, ketidaksesuaian saluran, keadaan emosi ekstrem, penyakit, penuaan, mimikri
oleh manusia dan tape recorder.
Langkah pertama untuk mengembangkan sistem pengenalan pembicara adalah mengumpulkan data suara dari 10 pembicara (5
wanita dan 5 pria). Selanjutnya data suara diolah melalui proses standarisasi, diam
penghapusan, penghilangan noise, ekstraksi fitur MFCC, pemodelan dan penggunaan pengenalan pola
Buku Kode.
Penelitian ini menghasilkan akurasi lebih dari 95% pada data suara asli. Akurasi terbaik diperoleh
pada data latih : data uji proporsi 60% : 40% dengan nilai 97,92%. Untuk data dengan tambahan
Noise 20dB dan noise 15dB masing-masing menghasilkan nilai akurasi sebesar 36,53% dan 24,72%. Menambahkan Kebisingan
proses canceling (NC) sebelum ekstraksi fitur pada pengujian data menghasilkan penurunan sebesar 1,25%
akurasi pada data asli, peningkatan akurasi data sebesar 10,28% dengan tambahan noise sebesar 20dB
dan peningkatan akurasi data sebesar 16,25% dengan tambahan noise sebesar 15dB.
Untuk penelitian lebih lanjut, seseorang dapat mencoba berbagai nilai untuk masukan NC dan MFCC atau mencari nilai lain.
metode terkait untuk menangani masalah gangguan.
Collections
- UT - Computer Science [2245]