Skip to main content

Mi a kapcsolat a beszédszintézis és a felismerés között?

A beszédszintézis és a felismerés a számítógépes beszédelemzés két oldala.A beszédszintézis az emberi beszéd számítógép általi létrehozása;Például egy számítógépes írásbeli szöveget olvas.A beszédfelismerés a számítógépes információk létrehozása a beszélt szavakból, például egy papír diktálása a számítógépre.Noha a két folyamat nem áll közvetlenül kapcsolódik, a beszédszintézis és a felismerés egyaránt támaszkodik a számítógép azon képességére, hogy megértse az emberi beszédet és az inflexiót.Az egyik módszer a kimenet, a másik a bemenet.A folyamat két részből áll, egy részből az emberi interakcióval és egy nélkül.Az emberi rész az, amikor az emberi szavak beírják a programot;A nem emberi rész akkor fordul elő, amikor a program interoperálja a bemenetet.A program elolvassa a nyelvet, és meghatározza, mi az egyes szó, a mondat elhelyezésével és az írásjelekkel az inflexió meghatározására.Ha egy szót többféle módon lehet kiejteni, például az „élő” esetében, a program a közeli szavakat és a kontextus nyomait keresi annak meghatározására, hogy melyik szót használják valójában.A szavak ezután a program második részébe kerülnek, ahol hangosan beszélnek.

A beszédfelismerő programban a folyamat ellentétes.A bemenet egy emberi hangszóróból származik, amely szavakat mond egy számítógépre.A számítógép meghallgatja az egyes szót, és összehasonlítja a hangszóró hangja által generált mintát a lehetséges hangok és szavak könyvtárával.Ezután meghatározza a legvalószínűbb szót, és elküldi azt a rendszer második részéhez.Ez a rész valójában kinyomtatja a szavakat a képernyőn, hasonlóan ahhoz, hogy a szintézis program azt mondja a szavak.Az egyik módja annak, hogy az emberek legyőzzék ezeket a hibákat az individualizált beszédprofilok révén.Egyetlen beszélőnek a programja elemzi beszédét, hogy megtalálja a konkrét vokális mintáit.Amikor hibákat talál a számítógépes fordításban, kifejezetten kijavíthatja őket.A korrekciókat a program elemzi és tárolja, így amikor a zavaró szó újra megjelenik, a program helyesen lefordítja.Az orvosi területen ezek a programok lehetővé teszik az emberek kommunikációját, akik egyébként esetleg nem képesek.Ezeknek a programoknak széles körű alkalmazása van az üzleti életben, mint a jelentések és dokumentumok fordításának gyorsabb eszköze.A beszédfelismerés szintén általános módszer a kihangosító eszközök beállítására az autókban, lehetővé téve az emberek számára, hogy vezetés közben biztonságosabban beszéljenek a telefonon.