Skip to main content

Hva er naturlig språkbehandling?

Natural Language Processing (NLP) er en måte å oversette mellom dataspråk og menneskelige språk.Målet med dette feltet er å la datamaskiner forstå hva en tekst sier uten å få presise verdier og ligninger for dataene som teksten inneholder.I hovedsak automatiserer naturlig språkbehandling oversettelsesprosessen mellom menneskelige og dataspråk.Mens mye av dette feltet er avhengig av statistikk og modeller for å bestemme sannsynlige betydninger av en setning, er det og har vært mange forskjellige tilnærminger til dette problemet.Funn på dette feltet har applikasjoner innen talegjenkjenning, oversettelse av menneskelig språk, informasjonsinnhenting og til og med kunstig intelligens.

Og ikke alle ledetråder til mening er inneholdt i selve språket.Selv en fullstendig redegjørelse for hele grammatikken til et språk, inkludert alle unntak, tillater ikke alltid en datamaskin å analysere informasjonen som er i en tekst.Noen setninger er syntaktisk tvetydige, ord har ofte mer enn én betydning, og noen kombinasjoner av lyder eller symboler endrer betydningen avhengig av grensene for ordene og mdash;Alt dette kan være problemer for en datamaskin som ikke forstår kontekst.Enda viktigere er mye av språket avhengig av en forbindelse til det fysiske og sosiale universet mdash;Noen setninger, for eksempel talehandlinger, formidler ikke informasjon så mye som handlinger om verden.Selv om en datamaskin har en perfekt forståelse av syntaks og semantikk for menneskelig språk, må teksten som skal analyseres være fri for menneskelige enheter, for eksempel sarkasme eller passiv aggresjon, for at datamaskinen skal finne riktig hva teksten betyr. Ideologisk, naturligSpråkbehandling er et system med interaksjon mellom mennesker og datamaskiner som styres av ideen om at de fleste databrukere er mer komfortable med å jobbe med datamaskiner på et menneskelig språk de allerede kjenner enn å tilpasse seg et datamaskinspråk.Det utnytter også det faktum at mye av menneskelig kunnskap allerede er kodet i menneskets språk, og tekstene som inneholder den kunnskapen kan oversettes til logiske strukturer som kan strømlinjeformes for en datamaskin.Mens mange prosjekter på dette feltet jobber for å hente ut datamaskindata fra menneskelige språktekster, brukes også naturlig språkbehandling til å generere menneskelig lesbare tekster fra datadata.Både disse forståelses- og generasjonsanleggene kan brukes av den samme teknologien, for eksempel i tilfelle av applikasjoner som oversettes fra et menneskelig språk til et annet ved å først avkode teksten til et dataspråk, og deretter kode den på et annet menneskelig språk.Innovasjonene oppnådd i naturlige språkbehandlingsinnsatser er også påfallende anvendelige for kunstig intelligensprosjekter på grunn av i hvilken grad menneskelignende intelligens er definert av en mestring av kompleksitetene i menneskets språk.