Skip to main content

Sự trùng lặp là gì?

Sự trùng lặp là một quá trình được sử dụng để loại bỏ dữ liệu dự phòng.Trong quá trình này, một ổ cứng máy tính được quét cho các chuỗi dữ liệu lớn trên các cửa sổ so sánh.Trong khi quét dữ liệu trùng lặp, trình tự của tám kilobyte trở lên thường được chọn ra.Nếu trình tự được tìm thấy ở nơi khác trên hệ thống lưu trữ, tệp trùng lặp được tham chiếu thay vì được lưu trữ lại.Việc sao chép dữ liệu chiếm căn phòng không cần thiết trong hệ thống và khi dữ liệu bên ngoài bị xóa, điều này khiến người dùng có nhiều không gian lưu trữ hơn trên máy tính.Điều này sẽ cho phép hệ thống chạy nhanh hơn và hiệu quả hơn vì nó không bị sa lầy với dữ liệu bổ sung.Ngoài ra, cải tiến băng thông luôn đáng chú ý hơn khi máy tính có nhiều không gian trống hơn.cần thiết.Thông thường, dữ liệu chính xác tương tự có thể được lưu trữ ở tới 100 địa điểm khác nhau trên ổ cứng.Nếu mỗi người chiếm một megabyte của không gian, sự trùng lặp sẽ làm giảm không gian này trên ổ cứng từ 100 megabyte xuống chỉ một.Quá trình này hoạt động bằng cách lưu trữ dữ liệu và không gian bổ sung có được là rất có lợi cho ổ cứng của máy tính.chẳng hạn như năng lượng, không gian và yêu cầu làm mát, khôi phục mức độ dịch vụ cao hơn, loại bỏ nhiều loại lỗi khác nhau và thu hồi dữ liệu tại một số điểm khác nhau.Một nhược điểm của sự trùng lặp là nó xác định dữ liệu trùng lặp bằng các hàm băm mật mã, có thể không đáng tin cậy và một vụ va chạm hoặc loại lỗi khác sẽ dẫn đến việc mất dữ liệu.Ngoài ra, nếu người cho phép thủ tục không biết về việc giảm dự phòng liên quan, độ tin cậy của máy tính có thể bị ảnh hưởng xấu.

Dữ liệu sao chép hoạt động bằng cách phân đoạn trước mỗi phần dữ liệu được xử lý.Mỗi phân đoạn được xác định và so sánh với dữ liệu đã có trong hệ thống.Nếu dữ liệu là duy nhất, nó được lưu trữ trên đĩa.Nếu đó là một đoạn dữ liệu trùng lặp, một tham chiếu được tạo thay thế.Sự trùng lặp có thể được triển khai bằng cách sử dụng phần mềm có tên là Data Domain, hoạt động với dữ liệu và hệ thống lưu trữ để lọc qua dữ liệu, tham khảo, loại bỏ hoặc lưu trữ từng byte, nếu phù hợp.