Skip to main content

Hvad er korpussprogvidenskab?

Corpus sprogvidenskab Undersøgelsen af sprog ved hjælp af virkelige eksempler.Det er ikke en gren af sprogvidenskab, men en metode eller tilgang. Corpus , det latinske ord for krop, henviser til kroppen af naturlige tekster, og fremgangsmåden involverer at opdage mønstre for sprogbrug gennem analyse af korpuset.Corpus Linguistics oplever et comeback, da computerprogrammer har revolutioneret tilgangen.

Forældrende dagbøger i en barns tale, da han først får sprog, er et simpelt eksempel på et korpus, der derefter kan studeres for at lære sprogmønstre.Undervisning i fremmedsprog i første halvdel af det 20. århundrede brugte ofte korpora af målsproget til at kompilere ordforrådslister til studerende.Den fremtrædende sprogforsker Noam Chomsky betragtede ikke brugen af Corpora som et gyldigt værktøj, da han mente, at sprogkompetence var vigtigere end præstationsdata.Tidlig korpussprogvidenskab var stort set baseret på antagelsen om, at der er et begrænset antal sætninger på et naturligt sprog, og at disse sætninger kan indsamles og evalueres.

Efter at have faldet ud af fordel i 60'erne og 70'erne, oplever Corpus Linguistics en revivalPå grund af den metodologiske brug af computeren.Concordance -programmet er navnet på den software, der oftest bruges af lingvister.Mens søgning af mønstre i et korpus af millioner af ord ville tage for meget tid for et menneske, og resultaterne ville være mindre end nøjagtige, kan en computer søge og hente information på få sekunder.Det kan beregne frekvens, sortere data og udnytte korpora på måder, der var umulige i fortiden.

Corpus-baseret analyse kan undersøge, hvordan register påvirker sproget;Mønstre for sprogbrug, såsom hvordan mænd og kvinder bruger forskellige tagspørgsmål;i hvilket omfang sprogmønstre bruges;og de faktorer, der påvirker variationen i sprogbrug.Undervisning kan drage fordel af corpus sprogvidenskab i designet af pensum, udviklingen af de anvendte materialer og den type aktiviteter, der bruges i klasseværelset.Studerende kunne drage fordel af fremgangsmåden ved at være i stand til at bestemme mere tydeligt de forskellige anvendelser og betydninger af almindelige ord, forskellene, der er forbundet med skriftligt og talt sprog, og sætninger og kollokationer, de kunne gøre brug af.Data af data, der er korpuset, opdateres konstant og er produktet af virkelige sociale interaktioner.Således er korporaen naturalistiske data, der let kan fås, og resultaterne kan generaliseres.