Skip to main content

Từ vựng được kiểm soát là gì?

Từ vựng được kiểm soát là một khái niệm về khoa học máy tính và lập trình máy tính chỉ liên quan đến việc chỉ sử dụng các thuật ngữ đã được thỏa thuận hoặc phê duyệt trước đây khi xây dựng cơ sở dữ liệu quan hệ, siêu dữ liệu có thể tìm kiếm hoặc các hệ thống khác trong đó các từ có thể đọc được để đánh dấu thông tin để truy xuất sau này.Phương pháp sử dụng từ vựng được kiểm soát để phân loại thông tin trái ngược với khái niệm từ vựng ngôn ngữ tự nhiên, trong đó không có điều khoản nào được thỏa thuận và tất cả các từ được sử dụng thay vào đó được kết nối bởi các mối quan hệ có trọng số.Ngoài các từ cấp cao nhất được sử dụng trong từ vựng được kiểm soát, các từ hỗ trợ có thể được sử dụng để các từ đồng nghĩa hoặc các thuật ngữ khác được liên kết chặt chẽ với thuật ngữ cấp cao nhất có thể kích hoạt việc sử dụng từ cấp cao nhất.Sự khác biệt chính được đo giữa các hệ thống ngôn ngữ tự nhiên và hệ thống từ vựng được kiểm soát là sự liên quan của kết quả của một truy vấn sử dụng các từ, khối lượng thông tin được trả về và khả năng sử dụng chung của hệ thống. Có nhiều trường hợp trong đóThu thập các từ hoặc thuật ngữ được sử dụng để tạo thông tin tùy ý, liên tục thay đổi hoặc vô tổ chức dễ tiếp cận hơn với người dùng.Các thuật ngữ tìm kiếm trong một công cụ tìm kiếm internet, cơ sở dữ liệu thông tin của công ty và thậm chí một thư viện nghiên cứu kỹ thuật số là tất cả các ví dụ về các ứng dụng thông qua đó thông tin có thể được phân loại với các thuật ngữ siêu dữ liệu trái ngược với cấu trúc phân cấp nghiêm ngặt.Các từ được sử dụng để mô tả một đối tượng trong các tình huống như vậy xây dựng một loại chỉ mục tìm kiếm của nhóm thông tin lớn hơn. Một ví dụ về việc sử dụng từ vựng được kiểm soát có thể được nhìn thấy khi xem xét hệ thống nộp đơn cho một công ty.Các tệp phải được phân loại theo cách để chúng dễ dàng và có thể dự đoán được.Nếu một tập tin giao dịch với xe hơi, thì nó có thể được nộp theo các loại xe.Nếu một người khác cũng có một tệp liên quan đến xe hơi, không có từ vựng được kiểm soát, tệp có thể được đặt dưới ô tô tiêu đề, khiến hai tệp khó tìm với một tìm kiếm.Khi các danh mục được kiểm soát, thì tất cả các tệp liên quan đến xe hơi sẽ được đặt theo một tiêu đề đã được thỏa thuận.Điều này có nghĩa là bất cứ ai nhận thức được từ vựng sẽ có thể tìm kiếm thông tin một cách hiệu quả và chính xác.Tuy nhiên, một sự phức tạp với từ vựng là các thuật ngữ tìm kiếm khó khăn hơn, nếu không, không thể tạo tự động và thường yêu cầu một số can thiệp của con người, khiến nó trở thành một nhiệm vụ lớn để chuyển đổi cơ sở dữ liệu hiện có để sử dụng từ vựng được kiểm soát.Nếu từ vựng không đủ lớn, thì cũng có khả năng một truy vấn duy nhất đưa ra một khối lượng lớn thông tin đến mức không thực tế khi sắp xếp mà không cần sử dụng phương pháp truy vấn khác.