Skip to main content

Co to jest synteza mowy?

Synteza mowy to proces, w którym komunikacja werbalna jest replikowana przez sztuczne urządzenie.Komputer, który przekształca tekst na mowę, jest jednym rodzajem syntezatora mowy.

Najwcześniejsze formy syntezy mowy zostały zaimplementowane przez maszyny zaprojektowane tak, aby funkcjonować jak ludzki przewód głosowy.Przykładem jest maszyna do mówienia stworzona przez Wolfgang von Kempelen w 1700 roku.Dzięki temu urządzeniu mowa była wyprodukowana przez ryczącą kuchenną, trzcina duda i dzwonek klarnetu.Kuchenka została zaprojektowana tak, aby działała jak płuca, podczas gdy Glottis (obszar sznurków głosowych) był reprezentowany przez trzcinę duda.Dzwonek klarnetu służył jako usta.

Działanie urządzenia było całkowicie ręczne.Prawa ręka kontrolowała serię dźwigni, podczas gdy lewa ręka manipulowała dzwonkiem klarnetu (usta).Istniała również opcja podłączenia „nozdrzy”, aby uzyskać mniejszy dźwięk nosowy.Tak czy inaczej, dopóki podstawowe elementy sterujące były odpowiednio używane, maszyna otrzymała przepływ powietrza.Ten przepływ powietrza określił rodzaje dźwięków, które zostałyby wyprodukowane.

Kolejne maszyny mówienia w XVIII i XIX wieku utrzymywały tę konfigurację, choć nastąpiły ulepszenia.Na przykład pod koniec XIX wieku Joseph Faber stworzył maszynę do mówienia, która może odbierać wejście przez klawiaturę i pedał.Poza areną rozrywkową.Wynika to głównie z tego, że syntezatory mowy mogą być przechowywane w oprogramowaniu zamiast osobnej maszyny.Dodatkowo, z komputerami jako pomoc, synteza mowy może przybierać inną formę;Używanie ludzkich głosów jako głównego źródła dźwięku.

Ta forma syntezy mowy jest znana jako konatennacja.Proces działa poprzez połączenie różnych nagrań ludzkiej mowy.Powstały dźwięk jest znacznie bardziej naturalny i przyjemny dla ucha.Jest to w przeciwieństwie do programów wykorzystujących syntezę artykulacyjną, w których mowa jest replikowana przez skomputeryzowany model przewodu głosowego.

Komercyjne syntezatory mowy mogą stosować metody konatenatywne lub artykulacyjne, ale oba są w stanie osiągnąć ten sam cel;Możliwość zapewnienia ludziom możliwości usłyszenia tekstu.Jest to szczególnie pomocne w sytuacjach, w których czytanie jest obwodowe lub niemożliwe.

W świecie biznesu takie sytuacje są bardzo powszechne, szczególnie w przypadku transakcji telefonicznych.Bez alternatywnych tekstów (TTS) właściciele firm musieliby wydać pieniądze na zatrudnienie jeszcze większej liczby personelu obsługi klienta.Zsyntetyzowane rozwiązania unikają tego problemu, ponieważ wszystko jest wykonywane przez komputer;Nie istota ludzka.

Zsyntetyzowana mowa również odgrywa rolę w życiu codziennym, szczególnie w przypadku osób niepełnosprawnych.Mówienie zegarów, słowników i innych urządzeń mogą ułatwić osobom, które mają problemy z widzeniem lub czytaniem.Zsyntetyzowana mowa jest nawet w stanie dać głos osobom, które wcale nie mogły mówić.Steven Hawking, słynny fizyk, jest ważnym przykładem.Ponieważ choroba Lou Gehriga sprawiła, że wycisza go, Hawking używa syntezatora głosowego do komunikowania się z ludźmi.

Istnieją również aplikacje TTS, które pomagają osobom w różnych czynnościach komputerowych.Aby uzyskać tego rodzaju aplikacje, większość użytkowników będzie musiała kupić osobne oprogramowanie lub pobrać łatki.Ta ostatnia opcja jest zwykle bezpłatna, w zależności od używanego systemu operacyjnego lub programu edytora tekstu.Jeśli jednak osoba uchylonaES Aby kupić osobne oprogramowanie, mogą mieć dostęp do systemu wyższej jakości.Konkretne przykłady można zobaczyć za pomocą Natural Reader 7 i tekstu na głos 2.

Ostatecznie synteza mowy jest technologią, która zrewolucjonizowała sposób komunikacji ludzkości.W pewnym sensie daje własne życie.Daje to także światu możliwość usłyszenia myśli błyskotliwych osób, które normalnie byłyby bezdźwięczne.