Skip to main content

Hva er corpus lingvistikk?

Corpus Linguistics Study of Language ved bruk av eksempler i det virkelige liv.Det er ikke en gren av språkvitenskap, men en metodikk eller tilnærming. Corpus , det latinske ordet for kropp, refererer til kroppen av naturlige tekster, og tilnærmingen innebærer å oppdage mønstre av språkbruk gjennom analyse av korpuset.Corpus Linguistics opplever et comeback, ettersom dataprogrammer har revolusjonert tilnærmingen.

Foreldres dagbøker av en barns tale da han først skaffer seg språk er et enkelt eksempel på et korpus som deretter kan studeres for å lære språkmønstre.Fremmedspråklig undervisning i første halvdel av 1900 -tallet brukte ofte selskap av målspråket for å kompilere ordforrådslister for studenter.Den fremtredende språkforskeren Noam Chomsky vurderte ikke bruken av korpora som et gyldig verktøy, da han mente at språkkompetanse var viktigere enn ytelsesdata.Tidlig corpus lingvistikk var i stor grad basert på antagelsen om at det er et begrenset antall setninger på et naturlig språk, og at disse setningene kan samles og evalueres.på grunn av metodologisk bruk av datamaskinen.Concordance -programmet er navnet på programvaren som oftest brukes av lingvister.Selv om å søke på mønstre i et korpus med millioner av ord ville ta for mye tid til et menneske og resultatene ville være mindre enn nøyaktige, kan en datamaskin søke og hente informasjon på bare sekunder.Den kan beregne frekvens, sortere data og utnytte selskaper på måter som var umulige i fortiden.

Korpusbasert analyse kan se på hvordan register påvirker språket;Mønstre for språkbruk, for eksempel hvordan menn og kvinner utnytter tag -spørsmål;I hvilken grad språkmønstre brukes;og faktorene som påvirker variasjonen i språkbruk.Undervisning kan dra nytte av corpus lingvistikk i utformingen av pensum, utviklingen av materialene som brukes og den type aktiviteter som brukes i klasserommet.Studentene kunne dra nytte av tilnærmingen ved å kunne bestemme tydeligere de forskjellige bruksområdene og betydningen av vanlige ord, forskjellene som ligger i skriftlig og talespråk, og uttrykk og kollokasjoner de kunne benytte seg av.Data for data som er korpuset blir stadig oppdatert og er et produkt av sosiale interaksjoner i det virkelige liv.Dermed er korporaen naturalistiske data som lett kan nås, og funnene kan generaliseres.