Skip to main content

Web sâu là gì?

Web Deep Web là một phần của Internet bên ngoài các phương thức tìm kiếm tiêu chuẩn.Một công cụ tìm kiếm tiêu chuẩn tìm thấy các trang web bằng cách hiển thị một trang duy nhất và nhấp vào tất cả các liên kết.Điều này cho phép họ mở rộng từ một trang như một mạng nhện khổng lồ, tìm trang này sau khi liên kết.Quá trình này chỉ ghi lại một phần của các trang tồn tại trên internet;Một lượng lớn dữ liệu được phân loại hoàn toàn vì một trong nhiều lý do.Các trang này sẽ không bao giờ xuất hiện trong một công cụ tìm kiếm tiêu chuẩn và do đó, do đó, vô hình đối với hầu hết người dùng web. Web Surface Web là một phần của Internet mà hầu hết người dùng đều quen thuộc.Phần này chứa các trang web tiêu chuẩn và dịch vụ web mà hầu hết người dùng biết.Deep Web bao gồm thông tin mà chỉ các phần cụ thể của người dùng Internet mới biết hoặc cũng có quyền truy cập.Web sâu là rất lớn so với web bề mặt;Vào năm 2000, nó lớn hơn gần 50 lần so với Surface Web. Lý do web sâu tồn tại chủ yếu là do giới hạn trên các công cụ tìm kiếm.Khi các công cụ tìm kiếm xem qua các liên kết, chúng không thể truy cập một số loại trang web.Các trang này không bao giờ vào hệ thống và do đó, không bao giờ được lập chỉ mục.Khi người dùng tìm kiếm một trong những trang này, anh ta hoặc cô ta sẽ không bao giờ tìm thấy nó, vì công cụ tìm kiếm không ghi lại sự tồn tại của nó hoặc không truy cập nó. Có một số loại trang khác nhau khó hoặc không thể đối vớicông cụ tìm kiếm để lập chỉ mục.Các trang web động và dựa trên cơ sở dữ liệu thực tế là không thể, vì chúng yêu cầu đầu vào cụ thể tồn tại.Các trang web này được tạo thành tại chỗ, thường thông qua đầu vào của người dùng.Vì một trang năng động không tồn tại cho đến khi cần thiết, các công cụ tìm kiếm bỏ qua chúng vì họ không biết phải yêu cầu gì.Các trang web riêng tư hoặc gated chiếm một phần lớn khác của Web Deep.Vì các trang này yêu cầu thông tin đăng nhập hoặc thông tin đăng nhập và công cụ tìm kiếm không có, nó bị chặn truy cập thông tin ở phía bên kia của đăng nhập.Ngay cả với vấn đề này, một số trang web dựa trên đăng nhập là một phần của Surface Web.Trang web thiết lập các điều khoản đặc biệt để cho phép các công cụ tìm kiếm các trang của nó.Điều này là phổ biến trong số các trang có đăng ký mở và muốn tạo lưu lượng truy cập bổ sung.Các trang này không sở hữu bất kỳ liên kết nào đến các tài nguyên bên ngoài hoặc chủ động chặn các liên kết hiện có.Điều này ngăn các công cụ tìm kiếm không bao giờ vấp ngã trên trang, vì vậy nó không bao giờ được thêm vào bất kỳ danh sách nào.Điều này từng là phổ biến giữa các trang web cá nhân, nhưng những thay đổi trong việc sử dụng web hiện đại đã tạo ra hầu hết các trang cá nhân được liên kết và lập chỉ mục.