Skip to main content

Quel est le lien entre la synthèse et la reconnaissance de la parole?

La synthèse et la reconnaissance de la parole sont les deux côtés de l'analyse de la parole informatisée.La synthèse de la parole est la création d'un discours humain par un ordinateur;Par exemple, un ordinateur lisant du texte écrit.La reconnaissance de la parole est la création d'informations informatiques à partir de mots parlés, comme dicter un papier à un ordinateur.Bien que les deux processus ne soient pas directement liés, la synthèse de la parole et la reconnaissance reposent toutes deux sur la capacité d'un ordinateur à comprendre la parole humaine et l'inflexion.Une méthode est la sortie et l'autre est entrée.

Les processus utilisés par la synthèse et la reconnaissance de la parole sont très similaires, même si le produit final est différent.Le processus se compose de deux parties, une partie avec l'interaction humaine et une sans.La partie humaine est lorsque les mots humains entrent dans le programme;La partie non humaine est lorsque le programme interopérait l'entrée.

Un programme de synthèse de la parole prendra la contribution humaine dans la forme ou le langage humain typé ou écrit.Le programme lira la langue et déterminera ce qu'est chaque mot, en utilisant le placement et la ponctuation des phrases pour déterminer l'inflexion.Lorsqu'un mot pourrait être prononcé plusieurs façons, comme dans le cas de «Live», le programme recherchera les mots et les indices de contexte à proximité pour déterminer quel mot est réellement utilisé.Les mots iront ensuite à la deuxième partie du programme, où ils sont prononcés à haute voix.

Dans un programme de reconnaissance vocale, le processus est opposé.L'entrée provient d'un orateur humain disant des mots dans un ordinateur.L'ordinateur écoutera chaque mot et comparera le modèle généré par la voix du haut-parleur à une bibliothèque de sons et de mots possibles.Il prend ensuite une détermination du mot le plus probable et l'envoie à la deuxième partie du système.Cette partie imprime en fait les mots à l'écran, similaire à la façon dont le programme de synthèse dit les mots.

Étant donné que chaque locuteur semble légèrement différent, les programmes de synthèse et de reconnaissance de la parole ont souvent une large marge d'erreur.L'une des façons dont les gens combattent ces erreurs est par le biais de profils de vocation individualisés.Un seul orateur fera analyser son discours par le programme pour trouver ses modèles vocaux spécifiques.Lorsqu'il trouve des erreurs dans la traduction informatique, il peut les corriger spécifiquement.Les corrections sont analysées et stockées par le programme, donc lorsque le mot gênant revient à nouveau, le programme le traduisera correctement.

Il existe une large application pour la synthèse de la parole et les programmes de reconnaissance.Dans le domaine médical, ces programmes permettent aux gens de communiquer qui autrement ne pourraient pas ne pas être en mesure de le faire.Ces programmes ont une large application dans les affaires comme moyen plus rapide de traduire des rapports et des documents.La reconnaissance vocale est également une méthode courante pour configurer des appareils mains libres dans les automobiles, permettant aux gens de parler au téléphone plus en toute sécurité pendant la conduite.