Skip to main content

Hva er Word Sense Disambiguation?

Word Sense Disambiguation (WSD) ligger i kjernen av programvarene designet for å tolke språk.Tvetydige ord eller setninger kan forstås på flere måter, selv om bare en betydning er ment. Dis Embiguation søker å tyde den tiltenkte betydningen av ord og setninger.Dette området er ekstremt utfordrende for programmerere som har til oppgave å designe nøyaktige grensesnitt for å bygge bro mellom gapet mellom muntlig og skriftspråk, og datamaskingenererte oversettelser.

Programvare designet for å konvertere tale-til-tekst kan "lytte" til en bruker som snakker til en mikrofonog oversette talte ord til skrevne setninger.Brukeren dikterer tegnsetting, og interjiserer ord som "komma" og "periode" der det er aktuelt.Dette høres ganske greit ut, bortsett fra at mange ord høres nøyaktig like ut.

For eksempel, Kjenn og Nei eller I og Eye er fonetisk utskillelig.Word Sense Disambiguation hjelper til med å oversette, "Jeg burde vite det neste uke", ordentlig, ved å bruke det som i utgangspunktet er et sett med "hvis, da" regler som tar ordplassering og tilstøtende ord i betraktning som indikatorer på det tiltenkte ordet.Denne typen ordfølelse disambiguation er kjent som den "grunne tilnærmingen" og er ganske nøyaktig, men kan ikke alltid stole på.

En annen tilnærming er å anvende "verdenskunnskap", eller hvilken datamaskinspråklig kaller "dyp tilnærming."Denne tilnærmingen er avhengig av leksikoner som ordbøker og tesaurus for å bestemme et ords rette sans.Ordet

bass

kan for eksempel bety et musikkinstrument, en lapp eller en fisk.I sistnevnte tilfelle uttales det annerledes, og overlater det til WSD for å utlede hvilken uttale som skal brukes.Hvis den typede setningen tilfeldigvis er, "Bassen er tung", kan bare en skanning av setninger omgivende avsløre ledetråder, for eksempel å finne ordene "fiske", "båt", "dock", eller omvendt, "band", ""musikk ”eller“ sang. ”Hvis programmets ordfølelse disambiguation ikke er robust nok, eller hvis ytterligere ledetråder er fraværende, kan programmet gjøre feil i oversettelsen. I tillegg til "hvis, da" regler for den grunne tilnærmingen, brukes algoritmer også for å bestemme riktige tolkninger.I eksemplet ovenfor kan en algoritme finne stikkord i hele dokumentet som tydelig peker på en musikalsk tolkning, eller Visa Versa.Andre tilnærminger brukes også i WSD som i utgangspunktet er foredlinger eller utvidelser av disse grunnleggende tilnærmingene.

Word Sense Disambiguation er også viktig i verbale kommandogrensesnitt designet for å erstatte tastaturet og mdash;Ikke bare ved å videresende enkle operativsystemkommandoer, men i så komplekse oppgaver som å forske på nettet.Andre områder der WSD spiller en rolle inkluderer utvikling av det semantiske nettet og forbedrede kunstige intelligensmodeller.Faktisk vil ethvert område av vitenskap som er avhengig av en språklig bro mellom mennesker og maskin, bruke ordsansdypning.