Skip to main content

Ngôn ngữ học Corpus là gì?

Ngôn ngữ học Corpus Nghiên cứu ngôn ngữ bằng các ví dụ thực tế.Nó không phải là một nhánh của ngôn ngữ học mà là một phương pháp hay cách tiếp cận.

Corpus, từ Latin cho cơ thể, đề cập đến cơ thể của các văn bản tự nhiên và cách tiếp cận liên quan đến việc khám phá các mô hình sử dụng ngôn ngữ thông qua phân tích của kho văn bản.Ngôn ngữ học Corpus đang trải qua sự trở lại, vì các chương trình máy tính đã cách mạng hóa cách tiếp cận. Nhật ký cha mẹ của một bài phát biểu của trẻ khi anh ta có được ngôn ngữ là một ví dụ đơn giản về một kho văn bản có thể được nghiên cứu để học các mẫu ngôn ngữ.Dạy học ngoại ngữ trong nửa đầu thế kỷ 20 thường sử dụng ngôn ngữ mục tiêu để biên soạn danh sách từ vựng cho sinh viên.Nhà ngôn ngữ học nổi tiếng Noam Chomsky đã không coi việc sử dụng Corpora là một công cụ hợp lệ, vì ông tin rằng năng lực ngôn ngữ quan trọng hơn dữ liệu hiệu suất.Ngôn ngữ ngôn ngữ đầu tiên chủ yếu dựa trên giả định rằng có một số câu hạn chế trong ngôn ngữ tự nhiên và những câu đó có thể được thu thập và đánh giá.Do sử dụng phương pháp của máy tính.Chương trình phù hợp là tên của phần mềm được sử dụng phổ biến nhất bởi các nhà ngôn ngữ học.Mặc dù việc tìm kiếm các mẫu trong một kho hàng triệu từ sẽ mất quá nhiều thời gian cho một con người và kết quả sẽ không chính xác, máy tính có thể tìm kiếm và lấy thông tin chỉ trong vài giây.Nó có thể tính toán tần suất, sắp xếp dữ liệu và khai thác Corpoitora theo những cách không thể trong quá khứ. Phân tích dựa trên cơ thể có thể xem xét cách đăng ký ảnh hưởng đến ngôn ngữ;Các mô hình sử dụng ngôn ngữ, chẳng hạn như cách nam và nữ sử dụng các câu hỏi thẻ khác nhau;mức độ sử dụng các mẫu ngôn ngữ;và các yếu tố ảnh hưởng đến sự thay đổi của việc sử dụng ngôn ngữ.Dạy học có thể được hưởng lợi từ ngôn ngữ học trong thiết kế giáo trình, sự phát triển của các tài liệu được sử dụng và loại hoạt động được sử dụng trong lớp học.Học sinh có thể được hưởng lợi từ cách tiếp cận bằng cách có thể xác định rõ ràng hơn các cách sử dụng và ý nghĩa khác nhau của các từ thông thường, sự khác biệt vốn có trong ngôn ngữ viết và nói, và các cụm từ và cộng tác mà họ có thể sử dụng.Cơ thể của dữ liệu là kho văn bản được cập nhật liên tục và là sản phẩm của các tương tác xã hội ngoài đời thực.Do đó, Corpora là dữ liệu tự nhiên có thể dễ dàng truy cập và các phát hiện có thể được khái quát.