Skip to main content

การซ้ำซ้อนคืออะไร?

การซ้ำซ้อนเป็นกระบวนการที่ใช้ในการกำจัดข้อมูลซ้ำซ้อนในระหว่างกระบวนการฮาร์ดไดรฟ์ของคอมพิวเตอร์จะถูกสแกนสำหรับลำดับข้อมูลขนาดใหญ่ข้ามหน้าต่างเปรียบเทียบในขณะที่การสแกนสำหรับข้อมูลที่ซ้ำกันลำดับของแปดกิโลไบต์หรือมากกว่านั้นมักจะถูกเลือกออกหากพบลำดับที่อื่นในระบบจัดเก็บข้อมูลไฟล์ที่ซ้ำกันจะถูกอ้างอิงแทนที่จะเก็บไว้อีกครั้ง

การซ้ำซ้อนที่ประสบความสำเร็จสามารถกำจัดข้อมูลหลายกิโลไบต์บนคอมพิวเตอร์ซึ่งนำไปสู่ผลประโยชน์ที่ชัดเจนการทำสำเนาข้อมูลใช้เวลาที่ไม่จำเป็นในระบบและเมื่อลบข้อมูลภายนอกออกไปสิ่งนี้จะทำให้ผู้ใช้มีพื้นที่เก็บข้อมูลมากขึ้นบนคอมพิวเตอร์สิ่งนี้จะช่วยให้ระบบทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้นเพราะมันไม่ได้จมอยู่กับข้อมูลพิเศษนอกจากนี้การปรับปรุงแบนด์วิดท์จะสังเกตเห็นได้ชัดเจนขึ้นเสมอเมื่อคอมพิวเตอร์มีพื้นที่ว่างมากขึ้น

การซ้ำซ้อนเกี่ยวข้องกับการอ้างอิงข้อมูลจำนวนมากไปยังตำแหน่งแรกและลบสำเนาพิเศษของข้อมูลซึ่งมีการจัดทำดัชนีในกรณีที่ควรเป็นจำเป็น.บ่อยครั้งที่ข้อมูลที่แน่นอนเดียวกันสามารถเก็บไว้ในสถานที่ที่แตกต่างกันมากถึง 100 แห่งในฮาร์ดไดรฟ์หากแต่ละพื้นที่ใช้พื้นที่หนึ่งเมกะไบต์การซ้ำซ้อนจะลดพื้นที่นี้บนฮาร์ดไดรฟ์จาก 100 เมกะไบต์เป็นเพียงหนึ่งเดียวกระบวนการทำงานโดยเก็บข้อมูลและพื้นที่เพิ่มเติมที่ได้รับนั้นเป็นประโยชน์อย่างมากสำหรับฮาร์ดไดรฟ์ของคอมพิวเตอร์

ผลประโยชน์เพิ่มเติมของการซ้ำซ้อนรวมถึงการลดปริมาณพื้นที่สำรองที่ต้องการมากถึง 90 เปอร์เซ็นต์ลดต้นทุนเช่นข้อกำหนดด้านพลังงานพื้นที่และการระบายความร้อนการคืนค่าบริการในระดับที่สูงขึ้นกำจัดข้อผิดพลาดหลายประเภทและการกู้คืนข้อมูลในหลาย ๆ จุดข้อเสียเปรียบของการขจัดข้อมูลซ้ำซ้อนคือการระบุข้อมูลที่ซ้ำกันโดยใช้ฟังก์ชั่นแฮช cryptographic ซึ่งอาจไม่น่าเชื่อถือและการชนหรือข้อผิดพลาดประเภทอื่น ๆ จะส่งผลให้สูญเสียข้อมูลนอกจากนี้หากบุคคลที่ได้รับอนุญาตขั้นตอนไม่ได้ตระหนักถึงการลดความซ้ำซ้อนที่เกี่ยวข้องความน่าเชื่อถือของคอมพิวเตอร์อาจได้รับผลกระทบในทางลบ

ข้อมูลซ้ำซ้อนทำงานโดยการแบ่งส่วนข้อมูลแต่ละชิ้นที่ประมวลผลครั้งแรกแต่ละเซ็กเมนต์จะถูกระบุและเปรียบเทียบกับข้อมูลที่มีอยู่แล้วในระบบหากข้อมูลไม่ซ้ำกันจะถูกเก็บไว้ในดิสก์หากเป็นข้อมูลที่ซ้ำกันการอ้างอิงจะถูกสร้างขึ้นแทนการขจัดข้อมูลซ้ำซ้อนสามารถนำไปใช้โดยใช้ซอฟต์แวร์ที่เรียกว่า Data Domain ซึ่งทำงานร่วมกับข้อมูลและระบบจัดเก็บข้อมูลเพื่อกรองผ่านข้อมูลการอ้างอิงการกำจัดหรือจัดเก็บแต่ละไบต์ตามความเหมาะสม