การคัดลอกข้อมูลซ้ำคืออะไร

การคัดลอกซ้ำเป็นกระบวนการที่ใช้เพื่อกำจัดข้อมูลซ้ำซ้อน ในระหว่างกระบวนการฮาร์ดไดรฟ์ของคอมพิวเตอร์จะถูกสแกนเพื่อหาลำดับของข้อมูลจำนวนมากในหน้าต่างเปรียบเทียบ ในขณะที่สแกนหาข้อมูลที่ซ้ำกันจะมีการเลือกลำดับแปดกิโลไบต์ขึ้นไป หากพบลำดับที่อื่นในระบบจัดเก็บไฟล์ที่ทำซ้ำจะถูกอ้างอิงมากกว่าที่จะเก็บไว้อีกครั้ง

การขจัดข้อมูลซ้ำที่ประสบความสำเร็จสามารถกำจัดข้อมูลหลายกิโลไบต์บนคอมพิวเตอร์ซึ่งนำไปสู่ผลประโยชน์ที่ชัดเจน การทำสำเนาข้อมูลใช้พื้นที่ที่ไม่จำเป็นในระบบและเมื่อมีการลบข้อมูลภายนอกสิ่งนี้จะทำให้ผู้ใช้มีพื้นที่เก็บข้อมูลบนคอมพิวเตอร์มากขึ้น สิ่งนี้จะช่วยให้ระบบทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้นเพราะไม่ได้จมอยู่กับข้อมูลเสริม นอกจากนี้การปรับปรุงแบนด์วิดท์มักจะสังเกตได้ชัดเจนยิ่งขึ้นเมื่อคอมพิวเตอร์มีพื้นที่ว่างมากขึ้น

การทำสำเนาเกี่ยวข้องกับการอ้างอิงข้อมูลจำนวนมากไปยังตำแหน่งแรกและการลบสำเนาของข้อมูลเพิ่มเติมซึ่งเป็นดัชนีอย่างไรก็ตามในกรณีที่จำเป็นต้องใช้ บ่อยครั้งที่ข้อมูลที่แน่นอนเดียวกันสามารถเก็บไว้ในที่ต่างๆได้มากถึง 100 แห่งบนฮาร์ดไดรฟ์ หากแต่ละพื้นที่ใช้พื้นที่หนึ่งเมกะไบต์การขจัดข้อมูลซ้ำซ้อนจะลดพื้นที่บนฮาร์ดไดรฟ์จาก 100 เมกะไบต์เป็นเพียงหนึ่ง กระบวนการทำงานโดยการเก็บข้อมูลและพื้นที่เพิ่มเติมที่ได้รับนั้นมีประโยชน์มากสำหรับฮาร์ดไดรฟ์ของคอมพิวเตอร์

ประโยชน์เพิ่มเติมของการลดความซ้ำซ้อนรวมถึงการลดจำนวนของพื้นที่การสำรองข้อมูลที่จำเป็นมากถึง 90 เปอร์เซ็นต์ลดต้นทุนเช่นพลังงานพื้นที่และข้อกำหนดในการระบายความร้อนการคืนค่าบริการในระดับที่สูงขึ้นกำจัดข้อผิดพลาดหลายประเภท จุดต่าง ๆ ข้อเสียเปรียบของการขจัดข้อมูลซ้ำซ้อนคือมันระบุข้อมูลที่ซ้ำกันโดยใช้ฟังก์ชั่นแฮชการเข้ารหัสซึ่งอาจไม่น่าเชื่อถือและการชนกันของข้อมูลหรือข้อผิดพลาดชนิดอื่นจะทำให้ข้อมูลสูญหาย นอกจากนี้หากผู้ที่ได้รับอนุญาตกระบวนการไม่ได้ตระหนักถึงการลดความซ้ำซ้อนที่เกี่ยวข้องความน่าเชื่อถือของคอมพิวเตอร์อาจได้รับผลกระทบในทางลบ

การคัดลอกข้อมูลจะทำงานโดยการแบ่งส่วนข้อมูลแต่ละส่วนที่ประมวลผลก่อน แต่ละส่วนจะถูกระบุและเปรียบเทียบกับข้อมูลที่มีอยู่แล้วในระบบ หากข้อมูลไม่ซ้ำกันข้อมูลจะถูกเก็บไว้ในดิสก์ ถ้าเป็นข้อมูลที่ซ้ำกันการอ้างอิงจะถูกสร้างขึ้นแทน การทำซ้ำสามารถดำเนินการได้โดยใช้ซอฟต์แวร์ที่เรียกว่า Data Domain ซึ่งทำงานกับข้อมูลและระบบจัดเก็บข้อมูลเพื่อกรองข้อมูลอ้างอิงลบหรือจัดเก็บแต่ละไบต์ตามความเหมาะสม