Skip to main content

Qu'est-ce que la reconnaissance vocale robuste?

La reconnaissance de la parole robuste peut détecter adéquatement la parole dans des conditions défavorables comme des environnements bruyants ou dans des enregistrements rugueux.Cela peut avoir des applications importantes dans un certain nombre de domaines, tels que les forces de l'ordre ou la conception des aides auditives, par exemple.La recherche et le développement sur ce sujet se produisent dans les établissements universitaires, les entreprises privées et les organisations caritatives avec un intérêt dans ce domaine du monde entier.Les carrières dans ce domaine sont ouvertes à des gens comme les ingénieurs du son, les programmeurs informatiques et les audiologistes.

La reconnaissance de la parole conventionnelle souffre du problème d'avoir été conçue pour des environnements idéaux.Un algorithme peut reconnaître la parole si elle se produit dans un environnement calme avec peu ou pas de bruit de fond, et si l'orateur articule clairement les mots.De tels programmes peuvent lutter contre les accents qu'ils n'ont pas appris, et ils ont également tendance à se décomposer dans des environnements avec beaucoup de bruit de fond.Le monde est souvent bruyant, et donc un tel équipement peut être une utilisation limitée dans certains contextes sans reconnaissance vocale robuste.

En dictée, par exemple, la plupart des systèmes reposent sur un microphone porté près de la bouche, pour permettre à la voix des haut-parleurs de dominerLe programme peut donc traiter avec précision le discours.La reconnaissance vocale utilisée dans des applications telles que l'écoute à distance pour l'application de la loi, la conception des aides auditives et la restauration des enregistrements historiques peuvent également avoir des difficultés avec le bruit de fond.Une reconnaissance vocale robuste implique le développement d'algorithmes qui peuvent traiter et rejeter ce bruit pour laisser uniquement le discours.

Cela nécessite des capacités de calcul complexes.Les environnements bruyants peuvent contenir une grande variété de sons, ce qui rend difficile de simplement créer un filtre de passe qui réduirait une gamme de bruit.Le filtre peut ne pas attraper tous les bruits de problème et pourrait également interférer avec le discours.Dans une reconnaissance de la parole robuste, les programmeurs travaillent à développer des programmes qui peuvent identifier la parole et le séparer des autres pistes du son.Une fois séparés, il peut être soumis à une autre passe pour nettoyer le signal, permettant au programme d'exécuter un algorithme normal de reconnaissance de la parole pour déterminer ce qui est dit.

La reconnaissance de la parole précise peut être importante pour les menus automatisés, la dictée et d'autres réels réels-Mémisations à l'heure.Le développement d'une reconnaissance vocale robuste peut également aider à la création d'aides auditives et de logiciels qui, et à identifier les voix humaines dans un bourdonnement d'autres bruit, et les transmettre uniquement à l'auditeur.Cela rend la reconnaissance vocale plus utile dans des environnements tels que des fêtes bondées et des événements où plusieurs sons peuvent rivaliser, potentiellement à noyer des voix pour les auditeurs s'appuyant sur la reconnaissance vocale.