Skip to main content

Trang web cào là gì?

Một trang web cào là một trang web lấy nội dung từ các nguồn khác và tái bản nó, thường không có sự phân bổ.Các trang web như vậy được duy trì vì nhiều lý do và chúng rất quan tâm đến nhiều nhà sản xuất nội dung hợp pháp trên internet, bởi vì chúng đặt ra một số vấn đề.Hầu hết các trang web cạp vi phạm luật bản quyền bằng cách in lại nội dung mà không có sự đồng ý và không ghi có cho tác giả, và họ cũng tàn phá kết quả của công cụ tìm kiếm và xếp hạng trang web, điều này có thể gây khó khăn cho người dùng internet để tìm thấy các trang web họ thực sự muốn xem.Tính năng chính của trang web cạp là nó sử dụng phương tiện tự động để thu hoạch nội dung từ các trang web khác.Việc thực hành thu hoạch nội dung được gọi là Scraping, và nó có thể được thực hiện theo một số cách, từ việc tải xuống toàn bộ trang web đến rút nội dung ra khỏi các nguồn cấp dữ liệu được tạo ra trong RSS, XML và nguyên tử vì lợi ích của những người đọc muốn đăng kýđến một trang web, thay vì truy cập nó liên tục để kiểm tra tài liệu mới.Sau khi được cạo, nội dung được nâng nguyên văn và được cài đặt trên một trang web mới. Hầu hết các trang web cào được duy trì cho mục đích tạo doanh thu quảng cáo thông qua các quảng cáo được liên kết với trang web.Mọi người có thể ngây thơ tìm kiếm một cái gì đó, hạ cánh trên trang web cào, và sau đó nhấp vào quảng cáo ra khỏi sự nhầm lẫn.Các trang web cào cũng được sử dụng trong liên kết canh tác, một thực tiễn liên quan đến việc duy trì một số trang web mà tất cả liên kết với nhau, do đó thổi phồng thứ hạng của công cụ tìm kiếm.Bởi vì trang web cào có thể tước đi chủ sở hữu nội dung ban đầu của doanh thu.Nhiều quản trị web sử dụng nhiều kỹ thuật khác nhau trong nỗ lực đánh bại các trang web cào và một số người đã kêu gọi hành động từ phía các công cụ tìm kiếm và công ty quảng cáo, yêu cầu họ hủy bỏ các trang web cào hoặc làm cho chúng có lợi nhuận thấp hơn để thực hành ít hấp dẫn hơn.Trong trường hợp một trang web cào có tín dụng cho người tạo, điều này cũng có thể gây hại cho người tạo bằng cách làm cho nó trông như thể trang web của anh ấy hoặc cô ấy ở trong một khu phố xấu, với một số lượng lớn các liên kết spam.Do đó, bảng xếp hạng trong các công cụ tìm kiếm có thể giảm và chủ sở hữu trang web có thể bất lực để làm bất cứ điều gì về nó, vì chủ sở hữu trang web không thể kiểm soát ai liên kết với họ.Nhiều trang web như vậy sử dụng các lớp của Subterfuge để che giấu chủ sở hữu của họ.Một số quản trị web thất vọng đi trực tiếp đến công ty lưu trữ trang web cào, trích dẫn vi phạm bản quyền và yêu cầu loại bỏ ngay lập tức nội dung tranh chấp. Về mặt kỹ thuật, các công cụ tìm kiếm và các trang web tổng hợp tin tức cũng có thể được coi là trang web cào.Tuy nhiên, vì các trang web này được duy trì cho lợi ích công cộng và vì việc sử dụng vật liệu của chúng nằm trong hướng dẫn sử dụng hợp lý, các trang web này thường không được gộp với các trang web cào có hại.