Skip to main content

Mi a beszédszintézis?

A beszédszintézis egy olyan folyamat, ahol a verbális kommunikációt mesterséges eszközön keresztül replikálják.Az a számítógép, amely a szöveget beszédre konvertálja, egyfajta beszédszintetizátor.

A beszédszintézis legkorábbi formáit olyan gépeken hajtották végre, amelyek úgy működnek, hogy úgy működjenek, mint az emberi vokális traktus.Példa erre a Wolfgang Von Kempelen által létrehozott beszédgép.Ezzel az eszközzel a beszédet egy konyhai ordítás, egy duda nád és egy klarinét csengő útján készítették.A Kitchen Bellow -t úgy tervezték, hogy úgy viselkedjen, mint egy tüdő, míg a glottis (a hangsábelek területét) a duda nádon keresztül ábrázolták.A klarinét csengő a szájként szolgált.

Az eszköz működése teljesen kézi volt.A jobb kéz egy kar -sorozatot irányított, míg a bal kéz manipulálta a klarinét harangot (száj).Lehetőség volt arra is, hogy bedugja az „orrlyukakat”, hogy kevésbé orr hangot hozzon létre.Akárhogy is, mindaddig, amíg az alapvezérlőket megfelelően használják, a gép légáramot kapott.Ez a légáram meghatározta a előállított hangok típusait.A 18. és 19. században a későbbi beszédgépek fenntartották ezt a beállítást, bár javulások voltak.Például az 1800 -as évek végén Joseph Faber olyan beszédgépet készített, amely billentyűzeten és egy pedálon keresztül tudna bevinni.A gép szintén nagyon kreatív volt, mivel a hang egy mesterséges „arcon” jelent meg.Noha az emberi vokális traktus utánozásának előfeltétele továbbra is ugyanaz volt, a 20. század eleji beszédgépek jobb hangokat tudnak előállítani, mivel a bemenet pontosabb volt.A szórakoztató arénán kívül.Ennek oka elsősorban az, hogy a beszédszintetizátorokat külön gép helyett szoftverben lehet tárolni.Ezenkívül, mivel a számítógépek segédeszközként, a beszédszintézis eltérő formát vehet fel;Az emberi hangok felhasználása a hang fő forrásaként.A folyamat úgy működik, hogy összekapcsolja az emberi beszéd különféle felvételeit.A kapott hang sokkal természetesebb és kedveltebb a fül számára.Ez ellentétben áll az artikulációs szintézist használó programokkal, ahol a beszédet a vokális traktus számítógépes modelljével replikálják.Lehetőség arra, hogy lehetőséget adjon az embereknek a szöveg meghallgatására.Ez különösen hasznos olyan helyzetekben, amikor az olvasás zavaró vagy lehetetlen.

Az üzleti világban az ilyen helyzetek nagyon gyakoriak, különösen a telefonos tranzakciók esetében.A szöveg-beszéd (TTS) alternatívák nélkül az üzleti tulajdonosoknak még több ügyfélszolgálati személyzet felvételét kell költeniük.A szintetizált megoldások elkerülik ezt a problémát, mivel mindent számítógéppel végeznek;Nem ember.A beszélő órák, szótárak és egyéb eszközök megkönnyíthetik a dolgokat az emberek számára, akiknek nehézségeik vannak a látás vagy az olvasás.A szintetizált beszéd még hangot adhat azoknak az egyéneknek, akik egyáltalán nem tudtak beszélni.Steven Hawking, a híres fizikus, kiemelkedő példa.Mivel Lou Gehrig -kór némavá tette őt, Hawking hangszintetizátort használ az emberekkel való kommunikációhoz.

Vannak olyan TTS -alkalmazások is, amelyek segítenek az embereknek a különféle számítógépes tevékenységek elősegítésében.Az ilyen típusú alkalmazások beszerzéséhez a legtöbb felhasználónak külön szoftvert kell vásárolnia vagy javításokat kell letöltenie.Ez utóbbi opció általában ingyenes, a használt operációs rendszertől vagy a szövegszerkesztő programtól függően.Ha azonban egy személy határozES, hogy külön szoftvereket vásároljanak, hozzáférhetnek egy magasabb minőségű rendszerhez.A konkrét példák a Natural Reader 7 és a hangos hangon láthatók.

Végül a beszédszintézis olyan technológia, amely forradalmasította az emberiség kommunikációját.Bizonyos értelemben saját életét adja meg.Ezenkívül lehetőséget ad a világnak arra is, hogy meghallja a ragyogó egyének gondolatait, akik általában hangtalanok lennének.