Skip to main content

Mi a hangfelismerés?

A hangfelismerés a számítógépes tudomány két típusa egyikére utalhat: a kriminalisztikai hang azonosítás vagy a beszéd-szöveges képesség.Ez a cikk az utóbbi meghatározással foglalkozik.Például egy mikrofonba való beszélgetés ugyanazt az eredményt eredményezi, mint a szavak kézi gépelése billentyűzettel.Az egyszerűen megadott hangfelismerő szoftvert felismerhető szavak vagy kifejezések belső adatbázisával tervezték.A program egyezteti a beszéd audio aláírását az adatbázis megfelelő bejegyzéseivel.A probléma az egyéni beszédminták és ékezetek gyakorlatilag végtelen tömbjében rejlik, amelyet a természetes emberi hajlandóság összetett a szavak együttes futtatására.Az ing így szól, segítettem az Apple Wreck -nek egy szép strandot.Ha hangosan beszélt, úgy hangzik, hogy

Segítettem az Apple felismerésében.Felirat.Minden modell másképp viselkedik, és megvan a maga képességei és határai.

A hangfelismerő programok, amelyek megkövetelik a felhasználótól, hogy kiképezzék a szoftvert, hogy felismerjék konkrét stilizált beszédmintáikat,

hangszóró -függő

rendszereknek nevezzük.Az egyének általában otthon vagy az irodában használják az ilyen típusú programokat.Az e -mail, a feljegyzések, a betűk, az adatok és a szöveg bevitele a mikrofonba való beszélgetéssel.

Egyes hangfelismerő rendszerek, úgynevezett Diszkrét beszéd

rendszerek, a felhasználótól egyértelműen és lassan, valamint a szavak elválasztását követeli meg.

Folyamatos beszéd

A rendszereket úgy tervezték, hogy megértsék a természetes beszédmódot.A rendszer

hangszóró független , de csak egy kis szavak vagy kifejezések medencéjét érti meg.A hívó fél választhat egy kérdésre, hogy válaszoljon, általában igen vagy nem.Miután megkapta a választ, a rendszer a következő szintre növeli a hívót.Ha a hívó egyedi válaszokkal válaszol, akkor az automatizált válasz általában, sajnálom, nem értettem;Kérjük, próbálkozzon újra, a kérdés megismétlésével és a rendelkezésre álló válaszokkal.Az ilyen típusú hangfelismerést nyelvtani korlátozott elismerésnek is nevezik.Ezt a programot úgy tervezték, hogy kiválasztja a kulcsszavakat vagy kifejezéseket, és statisztikai legjobban tudjon kialakítani, hogy mit akar az ügyfél.Az egyértelműen elősegíti a hangfelismerést az igény azonosításában.Az ilyen típusú rendszernek sokkal intenzívebb adatbázisa van, mint a diszkrét beszédrendszerek, és

természetes nyelvfelismerésnek is nevezik.Ez a szoftver abban különbözik a korábbi modellektől, hogy nem igyekszik megérteni, amit mondanak, csak a beszélt szavak azonosítására.Mivel az angol nyelv sok szó hasonlóan hangzik, a hibák könnyen elkövethetők.Azonban a nagyvállalatok, mint a Microsoft, a hangfelismerésbe fektetnek be, és a Bill Gates saját előrejelzése szerint az ASR megérti a folyamatos beszédet a 2011 -es évre. Az ASR szoftver gyakran megtalálható a digitális hangfelvevőkön., amikor az egykori társaság megvásárolta az utóbbit.A kisebb szereplők között szerepel többek között a Fonix beszéd, Acula és Verbio, nagyvállalatokkalMint az IBM és a fent említett Microsoft, szintén befektet a technológiába.Noha sokan még mindig úgy érzik, hogy inkább a szoftverek kiképzése és a hibák kiképzése, mint a billentyűzet egyszerű használata, akkor jön az idő, amikor a hangfelismerő szoftver valószínűleg megszünteti ezt a rést.A billentyűzetek kibővítése a beszédhasználat megkülönböztető képességével valószínűleg gyakorivá válik.

A hangfelismerő szoftver egyre népszerűbbé válik, mivel kifinomultabbá válik.Különösen hasznos az üzleti életben, ahol az élő üzemeltető helyettesítheti a hívásokat, az információk terjesztésére, a megrendelések megtételére és más nagyon hasznos funkciók végrehajtására.Ugyanakkor az asztali alkalmazásként is részesíti előnyben, amelyet olyan híres szoftverek, mint például a Scansofts, a Dragonnaturally -Speaking és az IBMS viavoice segítségével segítenek.