Was ist Sprachsynthese?

Die Sprachsynthese ist ein Prozess, bei dem die verbale Kommunikation über ein künstliches Gerät repliziert wird. Ein Computer, der Text in Sprache umwandelt, ist eine Art von Sprachsynthesizer.

Die frühesten Formen der Sprachsynthese wurden durch Maschinen implementiert, die so ausgelegt waren, dass sie wie der menschliche Stimmapparat funktionieren. Die um 1700 von Wolfgang von Kempelen geschaffene Sprechmaschine ist ein Beispiel. Mit diesem Gerät wurde Sprache durch einen Küchenbalg, ein Dudelsackrohr und eine Klarinettenglocke erzeugt. Der Küchenbalg sollte wie eine Lunge wirken, während die Stimmritze (der Bereich der Stimmbänder) durch das Dudelsackrohr dargestellt wurde. Die Klarinettenglocke diente als Mund.

Die Bedienung des Gerätes erfolgte komplett manuell. Die rechte Hand steuerte eine Reihe von Hebeln, während die linke Hand die Klarinettenglocke (Mund) betätigte. Es gab auch die Möglichkeit, die "Nasenlöcher" zu verstopfen, um einen weniger nasalen Klang zu erzeugen. In jedem Fall erhielt die Maschine Luftstrom, solange die Grundsteuerungen ordnungsgemäß verwendet wurden. Dieser Luftstrom bestimmte die Art der Geräusche, die erzeugt werden würden.

Nachfolgende Sprechmaschinen im 18. und 19. Jahrhundert behielten diese Einstellung bei, obwohl es Verbesserungen gab. Zum Beispiel schuf Joseph Faber Ende des 19. Jahrhunderts eine Sprechmaschine, die Eingaben über eine Tastatur und ein Pedal empfangen konnte. Die Maschine war auch sehr kreativ, da der Ton durch ein künstliches "Gesicht" herauskam.

Zu Beginn des 20. Jahrhunderts ermöglichten Innovationen in der Elektronik eine noch stärkere Ausrichtung der Sprachsynthese. Obwohl die Prämisse, den menschlichen Stimmapparat zu imitieren, immer noch dieselbe war, konnten zu Beginn des 20. Jahrhunderts sprechende Maschinen bessere Klänge erzeugen, da die Eingabe präziser war.

Erst mit dem Aufkommen von Computern konnte die Sprachsynthese jedoch auch außerhalb des Unterhaltungsbereichs eingesetzt werden. Dies liegt hauptsächlich daran, dass Sprachsynthesizer in Software statt auf einem separaten Computer gespeichert werden könnten. Mit Computern als Hilfsmittel könnte die Sprachsynthese eine andere Form annehmen. Verwendung menschlicher Stimmen als Hauptquelle für Ton.

Diese Form der Sprachsynthese wird als verkettet bezeichnet. Der Prozess funktioniert, indem verschiedene Aufzeichnungen menschlicher Sprache verbunden werden. Der resultierende Klang ist viel natürlicher und angenehm für das Ohr. Dies steht im Gegensatz zu Programmen, die eine Artikulationssynthese verwenden, bei der die Sprache durch ein computergestütztes Modell des Stimmtrakts repliziert wird.

Kommerzielle Sprachsynthesizer können entweder verkettende oder artikulatorische Methoden anwenden, aber beide sind in der Lage, dasselbe Ziel zu erreichen. in der Lage sein, Menschen die Möglichkeit zu geben, Text zu hören. Dies ist besonders hilfreich in Situationen, in denen das Lesen aufdringlich oder unmöglich ist.

In der Geschäftswelt sind solche Situationen sehr verbreitet, insbesondere bei Telefontransaktionen. Ohne Text-to-Speech (TTS) -Alternativen müssten Unternehmer Geld ausgeben, um noch mehr Kundendienstmitarbeiter einzustellen. Synthetisierte Lösungen vermeiden dieses Problem, da alles vom Computer erledigt wird. kein menschliches Wesen.

Synthetisierte Sprache spielt auch im täglichen Leben eine Rolle, insbesondere für Menschen mit Behinderungen. Durch das Sprechen von Uhren, Wörterbüchern und anderen Geräten können Menschen, die Probleme beim Sehen oder Lesen haben, die Arbeit erleichtern. Synthetisierte Sprache kann sogar Personen eine Stimme geben, die überhaupt nicht sprechen konnten. Steven Hawking, ein berühmter Physiker, ist ein prominentes Beispiel. Da Lou Gehrigs Krankheit ihn stumm gemacht hat, verwendet Hawking einen Sprachsynthesizer, um mit Menschen zu kommunizieren.

Es gibt auch TTS-Anwendungen, die Menschen bei verschiedenen Computeraktivitäten unterstützen. Um diese Art von Anwendungen zu erhalten, müssen die meisten Benutzer separate Software kaufen oder Patches herunterladen. Die letztere Option ist in der Regel kostenlos, abhängig vom verwendeten Betriebssystem oder Textverarbeitungsprogramm. Wenn sich eine Person jedoch für den Kauf separater Software entscheidet, hat sie möglicherweise Zugriff auf ein höherwertiges System. Spezifische Beispiele finden Sie in Natural Reader 7 und Text Aloud 2.

Letztendlich ist die Sprachsynthese eine Technologie, die die Kommunikation der Menschheit revolutioniert hat. In gewisser Weise verleiht es dem Text ein Eigenleben. Es gibt der Welt auch die Möglichkeit, die Gedanken brillanter Individuen zu hören, die normalerweise stimmlos gewesen wären.

Was ist Sprachsynthese?

War dieser Artikel hilfreich?