Skip to main content

Hva er sammenhengen mellom talesyntese og anerkjennelse?

Syntese og anerkjennelse er de to sidene av datastyrt taleanalyse.Talesyntese er opprettelsen av menneskelig tale av en datamaskin;For eksempel en datamaskin som leser skriftlig tekst.Talegjenkjenning er opprettelsen av datamaskininformasjon fra talte ord, for eksempel å diktere et papir til en datamaskin.Mens de to prosessene ikke er direkte relatert, er talesyntese og anerkjennelse begge avhengige av datamaskinens evne til å forstå menneskelig tale og bøyning.Den ene metoden sendes ut og den andre er innspill.

Prosessene som brukes av talesyntese og gjenkjennelse er veldig like, selv om sluttproduktet er annerledes.Prosessen består av to deler, en del med menneskelig interaksjon og en uten.Den menneskelige delen er når menneskelige ord kommer inn i programmet;Den ikke-menneskelige delen er når programmet interopererer innspillet.

Et talesynteseprogram vil ta inn menneskelige innspill i form eller skrevet eller skriftlig menneskelig språk.Programmet vil lese språket og bestemme hva hvert ord er, ved å bruke setningsplassering og tegnsetting for å bestemme bøyning.Når et ord kan uttales på flere måter, for eksempel når det gjelder ‘live’, vil programmet se etter ord i nærheten og kontekstledninger for å bestemme hvilket ord som faktisk brukes.Ordene vil da gå til den andre delen av programmet, der de snakkes høyt.

I et talegjenkjenningsprogram er prosessen motsatt.Inngangen kommer fra en menneskelig høyttaler som sier ord til en datamaskin.Datamaskinen vil lytte til hvert ord og sammenligne mønsteret som genereres av høyttalers stemme med et bibliotek med mulige lyder og ord.Den gjør deretter en bestemmelse av det mest sannsynlige ordet og sender det til den andre delen av systemet.Denne delen skriver faktisk ut ordene på skjermen, på samme måte som synteseprogrammet sier ordene.

Siden hver høyttaler høres litt annerledes ut, har talesyntese og gjenkjennelsesprogrammer ofte en bred feilmargin.En av måtene folk bekjemper disse feilene er gjennom individualiserte taleprofiler.En enkelt foredragsholder vil ha sin tale analysert av programmet for å finne hans spesifikke vokalmønstre.Når han finner feil i datamaskinoversettelse, kan han spesifikt korrigere dem.Korrigeringene blir analysert og lagret av programmet, så når det plagsomme ordet kommer opp igjen, vil programmet oversette det riktig.

Det er en bred applikasjon for talesyntese og gjenkjennelsesprogrammer.I det medisinske feltet tillater disse programmene folk å kommunisere som ellers kanskje ikke er i stand til det.Disse programmene har en bred anvendelse i virksomheten som et raskere middel til å oversette rapporter og dokumenter.Talegjenkjenning er også en vanlig metode for å sette opp håndfrie enheter i biler, slik at folk kan snakke i telefonen tryggere mens de kjører.