Skip to main content

Ano ang mga pinaka -karaniwang problema sa pagkilala sa pagsasalita?

Ang software ng pagkilala sa pagsasalita ay sumulong nang malaki mula noong una itong naimbento, ngunit mayroon pa rin itong maraming malalaking problema na pumipigil sa pagiging eksklusibo bilang isang paraan ng transkripsyon.Ang ilan sa mga problema sa pagkilala sa pagsasalita na mahirap lutasin ay kasama ang mga pagkakaiba -iba sa pagbigkas ng mga salita, indibidwal na accent, homonyms at hindi kanais -nais na mga ingay.Ang isa pang hanay ng mga problema sa pagkilala sa pagsasalita ay nagsasangkot sa uri ng hardware na ginamit upang aktwal na i -input ang tunog, dahil ang mga resulta ay maaaring magkaroon ng isang malaking epekto sa kung paano isasalin ng software ang pagsasalita.Mayroon ding problema ng hindi alam ang konteksto ng mga salitang sinasalita, na maaaring humantong sa teksto na walang bantas o hindi tumpak na mga spellings.

Ang isa sa mga pinaka pangunahing mga problema sa pagkilala sa pagsasalita ay ang kalidad ng mga aparato ng pag -input na ginagamit.Kung ang isang mikropono ay hindi sapat na sensitibo at mdash;o labis na sensitibo at mdash;Pagkatapos ay maaari itong lumikha ng impormasyon sa audio na mahirap para sa software na mag -decipher.Ito ay totoo lalo na kapag ang isang mikropono ay sobrang sensitibo na ang pagsasalita ay nagulong, na ginagawang halos walang silbi ang pagkilala ng software.Ang isang katulad na problema ay nagmumula sa ingay sa background na maaaring may problema upang paghiwalayin mula sa pangunahing pagsasalita at maaaring maging sanhi ng hindi tumpak na mga pagsasalin kapag kasama sa pagproseso ng pagsasalita.mga problema.Kapag ang isang solong salita ay maaaring mabigkas sa maraming mga paraan, ang software ay maaaring malito at maling mag -intri ng sinasabi.Ang parehong maaaring mangyari kapag ang isang tao ay nagsasalita ng mas mabagal o mas mabilis kaysa sa inaasahan ng programa.Mayroong ilang mga bahagyang solusyon, tulad ng pagsasanay sa software sa mga pattern ng pagsasalita ng isang solong gumagamit at paggamit ng mga dynamic na algorithm ng pag-waring ng oras upang tumugma sa pagsasalita sa database ng mga sample, ngunit hindi nila malulutas ang lahat ng mga problema.

Ang pinaka-kumplikadoSa mga problema sa pagkilala sa pagsasalita ay ang pagkilala sa konteksto ng mga salitang sinasalita.Hindi matukoy ng software ng computer ang inilaan na kahulugan ng isang koleksyon ng mga salita, na humahantong sa isang bilang ng mga problema sa na -transcribe na teksto.Ang mga salitang may katulad na tunog, tulad ng kanilang at doon, ay maaari lamang tumpak na nabaybay kapag kilala ang konteksto ng paggamit.Para sa parehong kadahilanan na ito, ang tumpak na bantas ay halos imposible para sa software na ilagay batay lamang sa pag -alam ng pagkakasunud -sunod ng mga salita.Mayroong functional transkripsyon ng software na ginagamit sa mga patlang tulad ng gamot, ngunit ang resulta ay madalas na isang bloke ng mga salita nang walang anumang uri ng paghihiwalay, nangangahulugang nangangailangan pa rin ng isang transkripsyon ng tao upang mai -edit ang dokumento at lumikha ng isang mababasa na pangwakas na kopya.