Skip to main content

Jaké je spojení mezi syntézou řeči a rozpoznáváním?

Syntéza a rozpoznávání řeči jsou dvě strany počítačové analýzy řeči.Syntéza řeči je vytvoření lidské řeči počítačem;Například počítačový čtení psaný text.Rozpoznání řeči je vytváření počítačových informací z mluvených slov, jako je diktování papíru do počítače.Zatímco tyto dva procesy nejsou přímo příbuzné, syntéza a rozpoznávání řeči se spoléhají na schopnost počítače porozumět lidské řeči a inflexi.Jedna metoda je výstup a druhá je vstup.Proces se skládá ze dvou částí, jedné části s lidskou interakcí a druhou bez.Lidská část je, když do programu vstupují lidská slova;Nehumánní část je, když program interoperuje vstup.

Program syntézy řeči bude mít v podobě nebo psaný nebo psaný lidský jazyk.Program si přečte jazyk a určí, co je každé slovo, pomocí umístění věty a interpunkce k určení inflexe.Když by mohlo být slovo vysloveno několika způsoby, například v případě „živého“, bude program hledat blízká slova a kontextové stopy, aby určil, které slovo se skutečně používá.Slova pak půjdou do druhé části programu, kde se mluví nahlas.

V programu rozpoznávání řeči je proces opačný.Vstup pochází z lidského reproduktoru, který říká slova do počítače.Počítač bude poslouchat každé slovo a porovnat vzor generovaný hlasem reproduktoru s knihovnou možných zvuků a slov.Poté stanoví nejpravděpodobnější slovo a odešle jej do druhé části systému.Tato část ve skutečnosti vytiskne slova na obrazovce, podobně jako program syntézy říká slova.

Protože každý reproduktor zní mírně odlišně, syntézu a rozpoznávací programy řeči mají často širokou rozpětí chyb.Jedním ze způsobů, jak lidé bojují proti těmto chybám, jsou prostřednictvím individualizovaných řečových profilů.Jeden reproduktor bude mít jeho řeč analyzovanou programem, aby našel jeho specifické hlasové vzorce.Když najde chyby v překladu počítače, může je konkrétně opravit.Opravy jsou analyzovány a uloženy programem, takže když se znovu objeví obtížné slovo, program jej správně překládá.

Existuje široká aplikace pro syntézu řeči a rozpoznávací programy.V oblasti lékařské oblasti tyto programy umožňují lidem komunikovat, kteří jinak nemusí být schopni.Tyto programy mají v podnikání širokou aplikaci jako rychlejší prostředek k překládání zpráv a dokumentů.Rozpoznávání řeči je také běžnou metodou nastavení hands-free zařízení v automobilech, což lidem umožňuje bezpečněji mluvit po telefonu při jízdě.