Teknologi

Apa itu pengenalan ucapan yang kuat?

Pengenalan ucapan yang kuat dapat secara memadai mendeteksi pidato dalam kondisi yang merugikan seperti lingkungan yang bising atau dalam rekaman yang gatal.Ini dapat memiliki aplikasi penting di sejumlah bidang, seperti penegakan hukum atau desain alat bantu dengar, misalnya.Penelitian dan pengembangan ke dalam topik ini terjadi di lembaga akademik, perusahaan swasta, dan organisasi amal dengan minat di bidang ini di seluruh dunia.Karier di bidang ini terbuka untuk orang -orang seperti insinyur suara, pemrogram komputer, dan audiolog.

Pengenalan suara konvensional menderita dari masalah telah dirancang untuk lingkungan yang ideal.Suatu algoritma dapat mengenali pidato jika itu terjadi di lingkungan yang tenang dengan sedikit atau tanpa suara latar belakang, dan jika pembicara dengan jelas mengartikulasikan kata -kata tersebut.Program -program semacam itu dapat berjuang dengan aksen yang belum mereka pelajari, dan mereka juga cenderung rusak di lingkungan dengan banyak kebisingan latar belakang.Dunia sering berisik, dan dengan demikian peralatan semacam itu dapat digunakan secara terbatas dalam beberapa pengaturan tanpa pengenalan ucapan yang kuat.

Dalam dikte, misalnya, sebagian besar sistem mengandalkan mikrofon yang dikenakan dekat dengan mulut, untuk memungkinkan suara speaker mendominasiJadi program dapat secara akurat memproses pidato.Pengenalan suara yang digunakan dalam aplikasi seperti mendengarkan jarak jauh untuk penegakan hukum, desain alat bantu dengar, dan pemulihan rekaman bersejarah juga dapat mengalami kesulitan dengan kebisingan latar belakang.Pengenalan ucapan yang kuat melibatkan pengembangan algoritma yang dapat memproses dan membuang kebisingan ini untuk meninggalkan pidato.

Ini membutuhkan kemampuan komputasi yang kompleks.Lingkungan yang bising dapat berisi berbagai macam suara, membuatnya sulit untuk membuat filter lulus yang akan memotong berbagai kebisingan.Filter mungkin tidak menangkap semua suara masalah, dan berpotensi mengganggu pidato juga.Dalam pengenalan suara yang kuat, programmer bekerja untuk mengembangkan program yang dapat mengidentifikasi pidato dan memisahkannya dari trek suara lainnya.Setelah dipisahkan, mungkin dikenakan operan lain untuk membersihkan sinyal, memungkinkan program untuk menjalankan algoritma pengenalan suara normal untuk menentukan apa yang dikatakan.

Pengenalan ucapan yang akurat dapat menjadi penting untuk menu otomatis, dikte, dan nyata lainnya yang nyataAplikasi -Time.Pengembangan pengenalan ucapan yang kuat juga dapat membantu penciptaan alat bantu dengar dan perangkat lunak yang dan menunjukkan suara -suara manusia dalam dengungan kebisingan lain, dan mengirimkannya ke pendengar.Ini membuat pengenalan ucapan lebih berguna di lingkungan seperti pesta dan acara yang ramai di mana banyak suara dapat bersaing, berpotensi menenggelamkan suara untuk pendengar yang mengandalkan pengenalan ucapan.