Skip to main content

Một từ dừng là gì?

Trong các ứng dụng điện toán và trực tuyến, một từ dừng là một từ được lọc ra trong quá trình xử lý một số loại văn bản, chẳng hạn như trong quá trình bắt đầu tìm kiếm trực tuyến.Được biết đến như một thành phần của xử lý ngôn ngữ tự nhiên hoặc NLP, ý tưởng đằng sau loại lọc này là giúp đẩy nhanh các tìm kiếm bằng cách bỏ qua các bài phát biểu chung từ yêu cầu.Thay vào đó, công cụ tìm kiếm sử dụng một điểm đánh dấu đơn giản để lưu ý sự hiện diện của từ trong chuỗi văn bản nhưng không ngăn chặn sự hiện diện của điểm đánh dấu đó bao gồm trang đó trong kết quả tìm kiếm.Một cách để hiểu làm thế nào các từ dừng có thể làm phức tạp chức năng của các công cụ tìm kiếm là xem xét thực tế là khi tiến hành tìm kiếm, động cơ sẽ xem xét mọi từ được đưa vào yêu cầu tìm kiếm do người dùng gửi.Là một phần của sự xem xét đó, động cơ tìm kiếm các trang chứa mỗi từ.Điều đó có nghĩa là nếu yêu cầu tìm kiếm chứa ba từ, động cơ thực hiện ba lần quét Internet, cuối cùng ưu tiên cho các trang bao gồm cả ba từ.Ví dụ, một cuộc tìm kiếm như Ngôi nhà trên đồi, sẽ yêu cầu động cơ thực hiện các tìm kiếm trên mỗi từ trong chuỗi, với một số người thậm chí đang chạy tìm kiếm trên từ dừng từ The The Twice Twice.Điều này cần có thời gian và tài nguyên có thể được chuyển hướng để hỗ trợ các tìm kiếm từ khóa khác mà người dùng cuối khác hiện đang tiến hành.Bằng cách sử dụng các điểm đánh dấu để thay thế các trò chơi trực tuyến và trên mạng trong quá trình tìm kiếm, động cơ có thể dành ít tài nguyên hơn và vẫn trả về kết quả rất có khả năng đáp ứng người dùng cuối.Mặc dù từ dừng đôi khi được gọi là từ

Poison, nhưng thực sự không có gì đặc biệt sai với việc bao gồm các bài phát biểu trong văn bản được sử dụng để tiến hành tìm kiếm.Việc sử dụng từ dừng hoặc từ như một phần của yêu cầu tìm kiếm có thể làm phức tạp quá trình lập chỉ mục công cụ tìm kiếm khi cố gắng truy xuất dữ liệu đáp ứng tiêu chí tìm kiếm.Tuy nhiên, người dùng cuối không có khả năng thấy nhiều sự khác biệt trong trích xuất thông tin mà cuối cùng được trả về.Không có danh sách từ dừng khó và nhanh được sử dụng trên toàn cầu bởi tất cả các công cụ tìm kiếm.Trên thực tế, một số công cụ tìm kiếm không sử dụng bất kỳ loại danh sách từ dừng như một phần của nhiệm vụ xử lý ngôn ngữ tự nhiên.Tuy nhiên, các công cụ khác sẽ sử dụng rộng rãi danh sách từ dừng như một phương tiện phân bổ tài nguyên một cách hiệu quả hơn, trong khi vẫn trả về các kết quả công cụ tìm kiếm chính xác và có khả năng phù hợp với các yêu cầu tìm kiếm được gửi bởi bất kỳ ai sử dụng mộtđộng cơ.