Skip to main content

Jaki jest związek między syntezą mowy a rozpoznawaniem?

Synteza i rozpoznawanie mowy to dwie strony skomputeryzowanej analizy mowy.Synteza mowy jest tworzeniem ludzkiej mowy przez komputer;Na przykład tekst czytania komputera.Rozpoznawanie mowy jest tworzeniem informacji komputerowych ze słów mówionych, takich jak dyktowanie papieru do komputera.Chociaż dwa procesy nie są bezpośrednio powiązane, synteza mowy i rozpoznawanie opierają się zarówno na zdolności komputera do zrozumienia ludzkiej mowy i fleksji.Jedna metoda jest wyjściowa, a druga wprowadza się.

Procesy stosowane przez syntezę i rozpoznawanie mowy są bardzo podobne, nawet jeśli produkt końcowy jest inny.Proces składa się z dwóch części, jednej części z interakcją człowieka i jednej bez.Część ludzka ma miejsce, gdy ludzkie słowa wchodzą do programu;Część nie-ludzka polega na tym, że program interperuje dane wejściowe.Program przeczyta język i określi, jakie jest każde słowo, za pomocą umieszczenia i interpunkcji zdania w celu ustalenia fleksji.Gdy słowo można było wymówić na wiele sposobów, na przykład w przypadku „Live”, program będzie szukał pobliskich słów i wskazówek kontekstowych w celu ustalenia, które słowo jest faktycznie używane.Słowa trafiają następnie do drugiej części programu, gdzie są wypowiedziane na głos.

W programie rozpoznawania mowy proces jest odwrotny.Wkład pochodzi od ludzkiego mówcy wypowiadającego słowa do komputera.Komputer będzie słuchać każdego słowa i porównuje wzór generowany przez głos mówcy z biblioteką możliwych dźwięków i słów.Następnie określa najbardziej prawdopodobne słowo i wysyła je do drugiej części systemu.Ta część faktycznie drukuje słowa na ekranie, podobnie jak program syntezy mówi słowa.

Ponieważ każdy głośnik brzmi nieco inaczej, programy syntezy i rozpoznawania mowy często mają szeroki margines błędu.Jednym ze sposobów, w jaki ludzie walczą z tymi błędami, są zindywidualizowane profile mowy.Jeden mówca przeanalizuje jego mowę w celu znalezienia jego specyficznych wzorów wokalnych.Kiedy znajdzie błędy w tłumaczeniu komputerowym, może je konkretnie poprawić.Korekty są analizowane i przechowywane przez program, więc kiedy pojawi się kłopotliwe słowo, program poprawnie je przetłumaczy.

Istnieje szeroka zastosowanie programów syntezy i rozpoznawania mowy.W dziedzinie medycyny programy te pozwalają ludziom komunikować się, którzy inaczej nie mogą nie być.Programy te mają szeroką aplikację w biznesie jako szybszy sposób tłumaczenia raportów i dokumentów.Rozpoznawanie mowy jest również powszechną metodą konfigurowania urządzeń bez użycia głośnomówiącego w samochodach, umożliwiając ludziom bezpieczniejsze rozmawianie przez telefon podczas jazdy.