Skip to main content

Ano ang synthesis ng pagsasalita?

Ang synthesis ng pagsasalita ay isang proseso kung saan ang komunikasyon sa pandiwang ay kinopya sa pamamagitan ng isang artipisyal na aparato.Ang isang computer na nagko -convert ng teksto sa pagsasalita ay isang uri ng synthesizer ng pagsasalita.

Ang pinakaunang mga anyo ng synthesis ng pagsasalita ay ipinatupad sa pamamagitan ng mga makina na idinisenyo upang gumana tulad ng tao na tinig ng tao.Ang nagsasalita ng makina na nilikha ni Wolfgang von Kempelen noong 1700 ay isang halimbawa.Gamit ang aparatong ito, ang pagsasalita ay ginawa sa pamamagitan ng isang wellow ng kusina, isang bagpipe tambo at isang clarinet bell.Ang Mellow ng Kusina ay idinisenyo upang kumilos tulad ng isang baga, habang ang Glottis (ang lugar ng mga tinig na boses) ay kinakatawan sa pamamagitan ng bagpipe reed.Ang clarinet bell ay nagsilbi bilang bibig.

Ang operasyon ng aparato ay ganap na manu -manong.Kinokontrol ng kanang kamay ang isang serye ng mga lever habang ang kaliwang kamay ay manipulahin ang clarinet bell (bibig).Mayroon ding pagpipilian ng pag -plug ng 'butas ng ilong', upang makabuo ng isang mas kaunting tunog ng ilong.Alinmang paraan, hangga't ang mga pangunahing kontrol ay maayos na ginamit, ang makina ay nakatanggap ng daloy ng hangin.Natukoy ng daloy ng hangin na ito ang mga uri ng mga tunog na magagawa.

Ang kasunod na mga makina ng pagsasalita sa buong ika -18 at ika -19 na siglo ay nagpapanatili ng pag -setup na ito, kahit na may mga pagpapabuti.Halimbawa, sa huling bahagi ng 1800s, lumikha si Joseph Faber ng isang nagsasalita ng makina na maaaring makatanggap ng input sa pamamagitan ng isang keyboard at isang pedal.Ang makina ay napaka -malikhain din, dahil ang tunog ay lumabas sa pamamagitan ng isang artipisyal na 'mukha.'Bagaman ang premise ng paggaya ng tao na vocal tract ay pareho pa rin, ang unang bahagi ng ika -20 siglo na nagsasalita ng mga makina ay maaaring makagawa ng mas mahusay na tunog dahil mas tumpak ang pag -input.Sa labas ng entertainment arena.Ito ay higit sa lahat dahil ang mga synthesizer ng pagsasalita ay maaaring maiimbak sa software sa halip na isang hiwalay na makina.Bilang karagdagan, sa mga computer bilang isang tulong, ang synthesis ng pagsasalita ay maaaring tumagal sa ibang anyo;Ang paggamit ng mga tinig ng tao bilang pangunahing mapagkukunan para sa tunog.

Ang form na ito ng synthesis ng pagsasalita ay kilala bilang concatenative.Gumagana ang proseso sa pamamagitan ng pagkonekta sa iba't ibang mga pag -record ng pagsasalita ng tao.Ang nagresultang tunog ay mas natural at nakalulugod sa tainga.Kabaligtaran ito sa mga programa na gumagamit ng articulatory synthesis, kung saan ang pagsasalita ay kinopya sa pamamagitan ng isang computerized na modelo ng vocal tract.Ang pagbibigay ng pagkakataon sa mga tao na makarinig ng teksto.Ito ay kapaki -pakinabang lalo na sa mga sitwasyon kung saan ang pagbabasa ay hindi kapani -paniwala o imposible.

Sa mundo ng negosyo, ang mga ganitong sitwasyon ay napaka -pangkaraniwan, lalo na sa mga transaksyon sa telepono.Kung walang mga alternatibong text-to-speech (TTS), ang mga may-ari ng negosyo ay kailangang gumastos ng pera sa pag-upa ng higit pang mga tauhan ng serbisyo sa customer.Ang mga synthesized solution ay maiwasan ang problemang ito, dahil ang lahat ay ginagawa ng computer;Hindi isang tao.Ang mga orasan ng pakikipag -usap, diksyonaryo at iba pang mga aparato ay maaaring gawing mas madali ang mga bagay para sa mga taong may problema na makita o pagbabasa.Ang synthesized speech ay nakapagbigay pa ng boses sa mga indibidwal na hindi makapagsalita.Si Steven Hawking, isang sikat na pisiko, ay isang kilalang halimbawa.Dahil ang sakit ni Lou Gehrig ay nagbigay sa kanya ng pipi, gumagamit si Hawking ng isang boses synthesizer upang makipag -usap sa mga tao.

Mayroon ding mga aplikasyon ng TTS na magagamit upang matulungan ang mga taong may iba't ibang mga aktibidad sa computer.Upang makuha ang mga ganitong uri ng mga aplikasyon, ang karamihan sa mga gumagamit ay kailangang bumili ng hiwalay na software o i -download ang mga patch.Ang huling pagpipilian ay karaniwang libre, depende sa operating system o programa sa pagproseso ng salita na ginagamit.Gayunpaman, kung ang isang tao ay nag -decidES Upang bumili ng hiwalay na software, maaari silang magkaroon ng access sa isang mas mataas na kalidad na sistema.Ang mga tiyak na halimbawa ay makikita sa pamamagitan ng natural na mambabasa 7 at teksto nang malakas 2.

Sa huli, ang synthesis ng pagsasalita ay teknolohiya na nagbago kung paano nakikipag -usap ang sangkatauhan.Sa isang kahulugan ay nagbibigay ito ng teksto ng isang buhay ng sarili nitong.Nagbibigay din ito sa mundo ng isang pagkakataon upang marinig ang mga saloobin ng mga makikinang na indibidwal na normal na walang saysay.