Skip to main content

Ano ang Corpus Linguistic?

Corpus Linguistic Ang pag-aaral ng wika gamit ang mga halimbawa ng totoong buhay.Ito ay hindi isang sangay ng linggwistiko ngunit isang pamamaraan o diskarte. Corpus , ang salitang Latin para sa katawan, ay tumutukoy sa katawan ng mga likas na teksto, at ang diskarte ay nagsasangkot ng pagtuklas ng mga pattern ng paggamit ng wika sa pamamagitan ng pagsusuri ng corpus.Ang Corpus Linguistic ay nakakaranas ng isang comeback, dahil ang mga programa sa computer ay nagbago ng diskarte.Ang pagtuturo ng wikang banyaga sa unang kalahati ng ika -20 siglo ay madalas na gumagamit ng corpora ng target na wika upang makatipon ang mga listahan ng bokabularyo para sa mga mag -aaral.Ang kilalang linggwistiko na si Noam Chomsky ay hindi isaalang -alang ang paggamit ng corpora ng isang wastong tool, dahil naniniwala siya na ang kakayahang pang -wika ay mas mahalaga kaysa sa data ng pagganap.Ang maagang Corpus Linguistic ay higit sa lahat batay sa pag -aakalang mayroong isang limitadong bilang ng mga pangungusap sa isang likas na wika at na ang mga pangungusap na iyon ay maaaring makolekta at masuri.Dahil sa pamamaraan ng paggamit ng computer.Ang concordance program ay ang pangalan ng software na kadalasang ginagamit ng mga linggwistiko.Habang ang paghahanap ng mga pattern sa isang corpus ng milyun -milyong mga salita ay aabutin ng maraming oras para sa isang tao at ang mga resulta ay mas mababa sa tumpak, ang isang computer ay maaaring maghanap at makuha ang impormasyon sa mga segundo lamang.Maaari itong kalkulahin ang dalas, pag-uri-uriin ang data at pagsamantalahan ang corpora sa mga paraan na imposible sa nakaraan. Ang pagsusuri na batay sa corpus ay maaaring tumingin sa kung paano nakakaapekto ang rehistro sa wika;Mga pattern ng paggamit ng wika, tulad ng kung paano ang mga lalaki at babae ay gumagawa ng iba't ibang paggamit ng mga katanungan ng tag;ang lawak ng mga pattern ng wika ay ginagamit;at ang mga kadahilanan na nakakaapekto sa pagkakaiba -iba ng paggamit ng wika.Ang pagtuturo ay maaaring makinabang mula sa corpus linguistic sa disenyo ng syllabus, ang pag -unlad ng mga materyales na ginamit, at ang uri ng mga aktibidad na ginamit sa silid -aralan.Ang mga mag -aaral ay maaaring makinabang mula sa diskarte sa pamamagitan ng kakayahang matukoy nang mas malinaw ang iba't ibang mga paggamit at kahulugan ng mga karaniwang salita, ang mga pagkakaiba na likas sa nakasulat at sinasalita na wika, at mga parirala at koleksyon na maaari nilang magamit.Ang katawan ng data na ang corpus ay patuloy na na-update at ang produkto ng mga pakikipag-ugnay sa lipunan sa totoong buhay.Kaya, ang corpora ay naturalistic data na madaling ma -access, at ang mga natuklasan ay maaaring pangkalahatan.