Skip to main content

Qu'est-ce que la synthèse de la parole?

La synthèse de la parole est un processus où la communication verbale est reproduite via un dispositif artificiel.Un ordinateur qui convertit le texte en parole est un type de synthétiseur de la parole.

Les premières formes de synthèse de la parole ont été mises en œuvre à travers des machines conçues pour fonctionner comme le tractus vocal humain.La machine parlante créée par Wolfgang von Kempelen dans les années 1700 en est un exemple.Avec cet appareil, la parole a été produite à travers une cuisine ci-dessous, un roseau à cornemas et une cloche de clarinette.La cuisine ci-dessous a été conçue pour agir comme un poumon, tandis que la glottis (la zone des cordes vocales) était représentée à travers le roseau à cornemuse.La clarinette a servi de bouche.

Le fonctionnement de l'appareil était complètement manuel.La main droite contrôlait une série de leviers tandis que la main gauche a manipulé la cloche de clarinette (bouche).Il y avait également la possibilité de brancher les «narines», pour produire un son moins nasal.Quoi qu'il en soit, tant que les commandes de base ont été correctement utilisées, la machine a reçu un flux d'air.Ce flux d'air a déterminé les types de sons qui seraient produits.

Les machines parlantes suivantes au XVIIIe et 19e siècles ont maintenu cette configuration, bien qu'il y ait eu des améliorations.Par exemple, à la fin des années 1800, Joseph Faber a créé une machine parlante qui pourrait recevoir une entrée via un clavier et une pédale.Bien que la prémisse d'imiter le tractus vocal humain était encore la même, les machines parlantes du début du 20e siècle pouvaient produire de meilleurs sons car l'entrée était plus précise.En dehors de l'arène de divertissement.Cela est principalement dû au fait que les synthétiseurs de la parole pourraient être stockés dans un logiciel au lieu d'une machine distincte.De plus, avec les ordinateurs comme aide, la synthèse de la parole pourrait prendre une forme différente;Utiliser les voix humaines comme principale source du son.

Cette forme de synthèse de la parole est connue sous le nom de concaténative.Le processus fonctionne en connectant divers enregistrements de discours humain.Le son qui en résulte est beaucoup plus naturel et agréable à l'oreille.Cela contraste avec les programmes qui utilisent la synthèse articulatoire, où la parole est reproduite par un modèle informatisé du tract vocal.

Les synthétiseurs de la parole commerciaux peuvent utiliser des méthodes concaténatives ou articulatoires, mais les deux sont capables d'atteindre le même objectif;Pouvoir donner aux gens l'occasion d'entendre du texte.Ceci est particulièrement utile dans les situations où la lecture est issue ou impossible.

Dans le monde des affaires, de telles situations sont très courantes, en particulier pour les transactions téléphoniques.Sans alternatives de texte vocale (TTS), les propriétaires d'entreprise devraient dépenser de l'argent à embaucher encore plus de personnel du service à la clientèle.Les solutions synthétisées évitent ce problème, car tout est fait par ordinateur;Pas un être humain.

La parole synthétisée joue également un rôle dans la vie quotidienne, en particulier pour les personnes handicapées.Les horloges, les dictionnaires et autres appareils parlants peuvent faciliter les choses pour les personnes qui ont du mal à voir ou à lire.Le discours synthétisé est même capable de donner une voix à des personnes qui ne pouvaient pas du tout parler.Steven Hawking, un célèbre physicien, est un exemple de premier plan.Depuis que la maladie de Lou Gehrig l'a rendu muet, Hawking utilise un synthétiseur vocal pour communiquer avec les gens.

Il existe également des applications TTS disponibles pour aider les personnes dans diverses activités informatiques.Pour obtenir ces types d'applications, la plupart des utilisateurs devront acheter des logiciels séparés ou télécharger des correctifs.Cette dernière option est généralement gratuite, selon le système d'exploitation ou le programme de traitement de texte utilisé.Cependant, si une personne décidees pour acheter des logiciels séparés, ils pourraient avoir accès à un système de meilleure qualité.Des exemples spécifiques peuvent être vus par le lecteur naturel 7 et le texte à haute voix 2.

En fin de compte, la synthèse de la parole est une technologie qui a révolutionné la façon dont l'humanité communique.Dans un sens, il donne à son propre texte une vie propre.Cela donne également au monde l'occasion d'entendre les pensées d'individus brillants qui n'auraient normalement pas été sans voix.