Hva er corpus lingvistikk?

Corpus lingvistikk Studiet av språk ved bruk av eksempler i det virkelige liv. Det er ikke en gren av språkvitenskap, men en metodikk eller tilnærming. Corpus , det latinske ordet for "kropp", refererer til kroppen av naturlige tekster, og tilnærmingen innebærer å oppdage mønstre for språkbruk gjennom analyse av korpuset. Corpus Linguistics opplever et comeback, ettersom dataprogrammer har revolusjonert tilnærmingen.

Foreldres dagbøker av et barns tale da han først anskaffer språk er et enkelt eksempel på et korpus som deretter kan studeres for å lære språkmønstre. Fremmedspråklig undervisning i første halvdel av 1900 -tallet brukte ofte selskap av målspråket for å kompilere ordforrådslister for studenter. Den fremtredende språkforskeren Noam Chomsky vurderte ikke bruken av korpora som et gyldig verktøy, da han mente at språkkompetanse var viktigere enn ytelsesdata. Tidlig corpus lingvistikk var i stor grad basert på antagelsen om at det er et begrenset antall setninger i en natural Språk og at disse setningene kan samles og evalueres.

Etter å ha falt ut av favør på 60- og 70 -tallet, opplever Corpus Linguistics en vekkelse på grunn av metodologisk bruk av datamaskinen. Concordance -programmet er navnet på programvaren som oftest brukes av lingvister. Selv om å søke på mønstre i et korpus med millioner av ord ville ta for mye tid for et menneske og resultatene ville være mindre enn nøyaktige, kan en datamaskin søke og hente informasjon på bare sekunder. Den kan beregne frekvens, sortere data og utnytte selskaper på måter som var umulige i fortiden.

Corpus-basert analyse kan se på hvordan register påvirker språk; Mønstre for språkbruk, for eksempel hvordan menn og kvinner utnytter tag -spørsmål; I hvilken grad språkmønstre brukes; og faktorene som påvirker variasjonen i språkbruk. Undervisning kan dra nytte avM Corpus Linguistics i utformingen av pensum, utviklingen av materialene som brukes og typen aktiviteter som brukes i klasserommet. Studentene kunne dra nytte av tilnærmingen ved å kunne bestemme tydeligere de forskjellige bruksområdene og betydningen av vanlige ord, forskjellene som ligger i skriftlig og talespråk, og uttrykk og kollokasjoner de kunne benytte seg av. Data for data som er korpuset blir stadig oppdatert og er et produkt av sosiale interaksjoner i det virkelige liv. Dermed er korporaen naturalistiske data som lett kan nås, og funnene kan generaliseres.

ANDRE SPRÅK