Skip to main content

Ano ang pagkilala sa boses?

Ang pagkilala sa boses ay maaaring sumangguni sa isa sa dalawang uri ng science sa computer: forensic boses pagkakakilanlan o kakayahan sa pagsasalita-sa-text.Ang artikulong ito ay tinutukoy ang huling kahulugan.Ang pagsasalita sa isang mikropono, halimbawa, ay gumagawa ng parehong resulta tulad ng pag -type ng mga salita nang manu -mano sa isang keyboard.Sa madaling sabi, ang software ng pagkilala sa boses ay dinisenyo gamit ang isang panloob na database ng mga nakikilalang mga salita o parirala.Ang programa ay tumutugma sa lagda ng audio ng pagsasalita na may kaukulang mga entry sa database.

Kahit na ang pagiging pagsasalita sa teksto ay maaaring maging madali, ito ay isang napakahirap na gawain.Ang problema ay namamalagi sa halos walang katapusang hanay ng mga indibidwal na pattern ng pagsasalita at accent, na pinagsama ng likas na pagkahilig ng tao na magpatakbo ng mga salita.Nabasa ang shirt, tinulungan ko ang Apple Wreck ng isang magandang beach.Kapag sinasalita nang malakas, parang,

Tumulong ako sa Apple na kilalanin ang pagsasalita.

Iba't ibang mga modelo ng software ng pagkilala sa boses ay ginagamit para sa isang hanay ng mga aplikasyon, mula sa personal na pagdidikta hanggang sa komersyal na awtomatikong pag -ruta ng tawag, mula sa pagtulong sa hindi pinagana hanggang sa sports at news eventsubtitling.Ang bawat modelo ay naiiba ang kumikilos at may sariling mga kakayahan at hangganan. Mga Programa sa Pagkilala sa Voice na nangangailangan ng gumagamit upang sanayin ang software upang makilala ang kanilang partikular na mga naka -istilong pattern ng pagsasalita ay tinatawag na

Speaker Dependent

Systems.Ang mga indibidwal ay karaniwang gumagamit ng mga ganitong uri ng mga programa sa bahay o sa opisina.Ang email, memo, titik, data at teksto ay maaaring maging input sa pamamagitan ng pagsasalita sa isang mikropono.

Ang ilang mga sistema ng pagkilala sa boses, na tinatawag na discrete speech system, ay nangangailangan ng gumagamit na magsalita nang malinaw at mabagal at upang paghiwalayin ang mga salita.

Patuloy na pagsasalita

Ang mga system ay idinisenyo upang maunawaan ang isang mas natural na mode ng pagsasalita.Ang system ay Speaker Independent , ngunit nauunawaan lamang ang isang maliit na pool ng mga salita o parirala.Ang tumatawag ay binigyan ng isang pagpipilian upang sagutin ang isang katanungan, karaniwang may oo o hindi.Matapos matanggap ang isang sagot, ang sistema ay tumataas sa tumatawag sa susunod na antas.Kung tumugon ang tumatawag na may natatanging sagot, ang awtomatikong tugon ay karaniwang, pasensya na, hindi kita maintindihan;Mangyaring subukang muli, na may isang ulitin ng tanong at magagamit na mga sagot.Ang ganitong uri ng pagkilala sa boses ay tinutukoy din bilang pagkilala sa pagkilala sa grammar.Ang program na ito ay idinisenyo upang pumili ng mga pangunahing salita o parirala at gumawa ng isang istatistika na pinakamahusay na hulaan kung ano ang nais ng customer.Ang pagsasalita ng malinaw na pagtulong sa pagkilala sa boses sa pagkilala sa pangangailangan.Ang ganitong uri ng system ay may mas masinsinang database kaysa sa maingat na mga sistema ng pagsasalita at tinutukoy din bilang natural na pagkilala sa wika.Ang software na ito ay naiiba sa mga nakaraang modelo sa hindi ito nagsusumikap na maunawaan kung ano ang sinasabi, lamang upang makilala ang mga salitang sinasalita.Dahil maraming mga salita sa wikang Ingles ang tunog na magkamukha, ang mga pagkakamali ay madaling magawa.Gayunpaman, ang mga pangunahing kumpanya tulad ng Microsoft ay namumuhunan sa pagkilala sa boses, at ang sariling hula ni Bill Gates ay may pag -unawa sa ASR ng patuloy na pagsasalita sa taong 2011. Ang software ng ASR ay madalas na matatagpuan sa mga digital na recorder ng boses., kasama ang dating kumpanya na nakakakuha ng huli.Ang mas maliit na mga manlalaro ay kasama ang Fonix Speech, Aculab at Verbio, bukod sa iba pa, kasama ang mga pangunahing korporasyonTulad ng IBM at ang nabanggit na Microsoft na namumuhunan din sa teknolohiya.Kahit na marami pa rin ang nakakaramdam na mas maraming problema sa pagsasanay ng software at tamang mga pagkakamali kaysa sa paggamit lamang ng isang keyboard, darating ang isang oras kapag ang software ng pagkilala sa boses ay malamang na isara ang puwang na iyon.Ang pagpapalaki ng mga keyboard na may kakayahang diskriminasyon na gumamit ng pagsasalita ay maaaring maging pangkaraniwan.

Ang software ng pagkilala sa boses ay nakakakuha ng katanyagan dahil nagiging mas sopistikado ito.Ito ay kapaki -pakinabang lalo na sa negosyo kung saan maaari itong palitan ang isang live na operator sa mga tawag sa funnel, magpakalat ng impormasyon, kumuha ng mga order at magsagawa ng iba pang kapaki -pakinabang na pag -andar.Gayunpaman, nakakakuha din ito ng pabor bilang isang application ng desktop, na tinulungan ng kilalang software tulad ng Scansofts, Dragonnaturallyspeaking at IBMS Viavoice .