Skip to main content

Máy quét màn hình là gì?

Một cạp màn hình là một chương trình máy tính thu thập dữ liệu dựa trên ký tự từ đầu ra hiển thị của chương trình khác.Bộ xử lý màn hình có thể trích xuất dữ liệu họ đang tìm kiếm và trình bày nó ở định dạng phong phú hơn, chẳng hạn như với đồ thị hoặc bảng hoặc chỉ đơn giản là lập chỉ mục dữ liệu để lưu trữ.Có nhiều tên khác cho một cái cào màn hình, bao gồm cào trang web, công cụ khai thác nội dung, trang web trang web, trình trích xuất web, bộ thu dữ liệu tự động và máy cạo HTML.Một cạp màn hình sẽ tìm kiếm thông qua mã của một trang web và lọc ra mã không liên quan để cung cấp một bài thuyết trình đẹp mắt cho trình duyệt cuối.Mã như vậy là cần thiết để xem toàn bộ trang trong bố cục dự định của nó, nhưng một cái cào chỉ đơn giản là tìm kiếm dữ liệu hữu ích.Dữ liệu này được thu thập và trình bày dưới dạng cơ sở dữ liệu đơn giản, không có tiếng chuông và huýt sáo mã HTML ban đầu được cung cấp. Một ví dụ điển hình về một cái cào màn hình hoạt động là với các nhện công cụ tìm kiếm.Những con nhện này truy cập hàng trăm ngàn trang web, mỗi con chứa nhiều trang bên trong.Dữ liệu từ khóa từ các trang web này được thu thập và lập chỉ mục, sau đó cuối cùng được trình bày cho người dùng cuối dưới dạng kết quả của công cụ tìm kiếm.JavaScript hoặc PHP.Dữ liệu được khai thác sau đó có thể được trình bày dưới dạng HTML, để người dùng có thể truy cập nó bằng trình duyệt web của họ hoặc được lưu trữ dưới dạng dữ liệu văn bản có thể được truy cập bởi người dùng ngoại tuyến.Các doanh nghiệp sử dụng bộ phế liệu màn hình để khai thác dữ liệu từ nhiều trang web liên quan đến từ khóa để tạo đồ thị, biểu đồ, bảng tính và dữ liệu so sánh được sử dụng trong các báo cáo và trình bày.Trà màn hình tiết kiệm một lượng thời gian phi thường, vì một nhân viên thực hiện cùng một nhiệm vụ sẽ phải tìm kiếm các trang web có liên quan, nhấp vào liên kết và duyệt từng trang web riêng lẻ để tìm và ghi lại dữ liệu hiện hành mà họ cần.Một cạp màn hình cũng có thể được sử dụng khi thông tin được lưu trữ trên một hệ thống không còn có thể được truy cập do các vấn đề tương thích với phần cứng hoặc phần mềm mới hơn.Trình cạo màn hình có thể là một phước lành vừa là một lời nguyền cho chủ sở hữu trang web và người lướt web.Mặc dù họ hoàn toàn cung cấp một dịch vụ chức năng cho các doanh nghiệp, công cụ tìm kiếm và các công cụ khác, nhưng một cái cào màn hình cũng có thể được sử dụng cho các mục đích thấp hơn vị tha.Ví dụ, các công ty hoặc cá nhân sử dụng thư rác làm phương thức quảng cáo có thể sử dụng máy cạo màn hình để khai thác địa chỉ e-mail từ các trang web.Đạo đức khi sử dụng chúng.Các vấn đề về bản quyền trở nên mờ khi một cạp màn hình trích xuất một số công việc chăm chỉ và trình bày nó ở định dạng khác cho một trang web khác và các trang web phụ thuộc vào quảng cáo để tạo doanh thu có vấn đề khi quảng cáo của họ bị loại bỏ bởi máy quét màn hình.Do đó, một số chủ sở hữu trang web đã bắt đầu thực hiện các công cụ sẽ ngăn các trang web của họ bị loại bỏ.