Skip to main content

Apa itu pemrosesan ucapan?

Pemrosesan pidato adalah proses di mana sinyal ucapan ditafsirkan, dipahami, dan ditindaklanjuti.Ini secara khusus mengacu pada pemrosesan pidato manusia oleh sistem terkomputerisasi, seperti dalam perangkat lunak pengenalan suara atau program suara-ke-teks.Pemrosesan bicara penting bagi banyak bidang untuk penggunaan teoritis dan praktis, mulai dari aktivasi suara dan kontrol di ponsel hingga pengembangan kecerdasan buatan fungsional dalam ilmu komputer.Interpretasi dan produksi pidato yang koheren keduanya penting dalam pemrosesan pidato;Namun, beberapa kekhawatiran mendukung satu sama lain, karena kebutuhan aplikasi pemrosesan bicara sangat beragam.

Pengakuan ucapan adalah salah satu aspek terpenting dari pemrosesan bicara karena tujuan keseluruhan pemrosesan pidato adalah untuk memahami dan bertindakbahasa lisan.Salah satu aplikasi pengenalan suara yang umum digunakan adalah konversi ucapan-ke-teks sederhana, yang digunakan dalam banyak program pengolah kata.Banyak aplikasi membutuhkan ketepatan yang jauh lebih tinggi daripada yang diperlukan untuk perangkat lunak konversi ucapan-ke-teks.Ada minat besar, misalnya, dalam menggunakan pengenalan suara di pesawat militer untuk mengurangi beberapa tanggung jawab pilot dan ketegangan.Agar ketepatan dan akurasi dapat dicapai, perlu bagi pembicara untuk mengkalibrasi perangkat lunak pengakuan dengan suara dan gaya berbicaranya sendiri.

Pengakuan pembicara, elemen lain dari pengenalan ucapan, adalah aspek lain yang sangat penting dari pemrosesan bicara,meskipun belum diterapkan secara luas seperti pengakuan ucapan umum.Sementara pengenalan ucapan merujuk secara khusus untuk memahami apa yang dikatakan, pengakuan pembicara hanya berkaitan dengan siapa yang berbicara.Memvalidasi identitas speaker dapat menjadi fitur keamanan penting untuk mencegah akses yang tidak sah ke atau penggunaan sistem komputer.

Komponen lain dari pemrosesan wicara adalah pengenalan suara, yang pada dasarnya merupakan kombinasi dari pengenalan bicara dan pembicara.Pengenalan suara terjadi ketika program pengenalan suara memproses pidato pembicara yang dikenal;Program -program semacam itu umumnya dapat menafsirkan pidato pembicara yang diketahui dengan akurasi yang jauh lebih besar daripada pembicara acak.

Topik studi lain di bidang pemrosesan bicara adalah analisis suara.Analisis suara berbeda dari topik lain dalam pemrosesan bicara karena tidak benar -benar peduli dengan konten linguistik pidato.Ini terutama berkaitan dengan pola dan suara bicara.Analisis suara dapat digunakan untuk mendiagnosis masalah dengan pita suara atau organ lain yang terkait dengan bicara dengan mencatat suara yang menunjukkan penyakit atau kerusakan.Patter suara dan stres juga dapat digunakan untuk menentukan apakah seseorang mengatakan yang sebenarnya, meskipun penggunaan analisis suara ini sangat kontroversial.