Identifikasi Pembicara pada Lingkungan yang Mengandung Noise Menggunakan Least Mean Square
View/ Open
Date
2014Author
Permana, Inggih
Buono, Agus
Silalahi, Bib Paruhum
Metadata
Show full item recordAbstract
Identifikasi pembicara merupakan bagian dari pengenalan pembicara yang bertujuan untuk mengetahui siapa yang berbicara dari suara yang ada. Studi ini berfokus pada identifikasi pembicara di lingkungan yang mengalami noise. Hal ini menarik untuk dikaji karena sebagian besar penelitian identifikasi pembicara yang ada sekarang berhasil mendapatkan hasil identifikasi yang bagus dalam lingkungan yang sengaja dibuat baik tetapi belum tentu dalam lingkungan yang dipenuhi noise. Studi ini menambahkan metode LMS (Least Mean Square) dalam praproses data agar bisa mengatasi masalah tersebut. LMS membuat proses identifikasi pembicara menjadi lebih baik karena sinyal suara yang dihasilkan setelah proses LMS adalah sinyal suara yang telah mengalami pengurangan noise. Studi ini juga memodifikasi teknik pengukuran kemiripan pada identifikasi pembicara. Modifikasi dilakukan dengan cara memilih pembicara yang memiliki jumlah pasangan vektor terbanyak sebagai pembicara yang mewakili suara yang diuji. Pasangan vektor disini adalah jarak terkecil vektor masukan dengan salah satu vektor yang ada pada codebook (cetakan suara) pembicara. Jumlah pembicara yang digunakan pada studi ini adalah 83 orang, yang terbagi menjadi 35 pembicara perempuan dan 48 pembicara laki-laki. Setiap pembicara memiliki 5 file suara dalam format wav. Panjang file suara adalah 1 sampai 39 detik. Perekaman dilakukan melalui telepon menggunakan sistem IVR (Interactive Voice Response). Sampling rate yang digunakan adalah 8000 Hz. Noise yang digunakan pada studi ini adalah white noise. Hasil percobaan menunjukan bahwa LMS berhasil membuat identifikasi pembicara menjadi lebih tahan terhadap noise. Akurasi identifikasi pembicara yang menggunakan LMS pada praproses data 77% lebih tinggi dari akurasi identifikasi pembicara yang tidak menggunakan LMS. Teknik pengukuran kemiripan yang ditawarkan berhasil menambah akurasi identifikasi pembicara diatas 15% pada suara yang mengandung noise.