Skip to main content

ข้อมูลซ้ำซ้อนคืออะไร?

การขจัดข้อมูลซ้ำซ้อนเป็นเทคนิคสำหรับการบีบอัดข้อมูลที่ถูกลบข้อมูลซ้ำโดยเก็บสำเนาหนึ่งชุดของแต่ละหน่วยข้อมูลไว้ในระบบแทนที่จะอนุญาตให้ทวีคูณเจริญเติบโตสำเนาที่เก็บรักษาไว้มีการอ้างอิงที่อนุญาตให้ระบบดึงข้อมูลได้เทคนิคนี้ช่วยลดความจำเป็นในการจัดเก็บพื้นที่และสามารถทำให้ระบบทำงานได้เร็วขึ้นนอกเหนือจากการ จำกัด ค่าใช้จ่ายที่เกี่ยวข้องกับการจัดเก็บข้อมูลมันสามารถทำงานได้หลายวิธีและใช้กับระบบคอมพิวเตอร์หลายประเภท

ในการขจัดข้อมูลระดับไฟล์ระดับไฟล์ระบบจะมองหาไฟล์ที่ซ้ำกันและลบข้อมูลพิเศษการขจัดข้อมูลซ้ำซ้อนระดับบล็อกจะดูที่บล็อกข้อมูลภายในไฟล์เพื่อระบุข้อมูลภายนอกผู้คนสามารถลงเอยด้วยข้อมูลสองเท่าด้วยเหตุผลหลายประการและการใช้ข้อมูลซ้ำซ้อนสามารถปรับปรุงระบบทำให้ง่ายต่อการใช้งานระบบสามารถตรวจสอบข้อมูลเป็นระยะเพื่อตรวจสอบการทำซ้ำกำจัดพิเศษและสร้างการอ้างอิงสำหรับไฟล์ที่ทิ้งไว้ข้างหลัง

บางครั้งระบบดังกล่าวเรียกว่าระบบการบีบอัดอัจฉริยะหรือระบบจัดเก็บข้อมูลอินสแตนซ์เดี่ยวทั้งสองข้อกำหนดอ้างอิงแนวคิดที่ว่าระบบทำงานได้อย่างชาญฉลาดในการจัดเก็บและข้อมูลไฟล์เพื่อลดการโหลดในระบบข้อมูลซ้ำซ้อนอาจมีค่าโดยเฉพาะอย่างยิ่งกับระบบขนาดใหญ่ที่มีการจัดเก็บข้อมูลจากแหล่งข้อมูลจำนวนมากและค่าใช้จ่ายในการจัดเก็บจะเพิ่มขึ้นอย่างต่อเนื่องเนื่องจากระบบจะต้องมีการขยายเมื่อเวลาผ่านไป

ระบบเหล่านี้ได้รับการออกแบบให้เป็นส่วนหนึ่งของระบบขนาดใหญ่สำหรับการบีบอัดและจัดการข้อมูลข้อมูลซ้ำซ้อนไม่สามารถป้องกันระบบจากไวรัสและความผิดพลาดและเป็นสิ่งสำคัญที่จะต้องใช้การป้องกันไวรัสที่เพียงพอเพื่อให้ระบบปลอดภัยและ จำกัด การปนเปื้อนของไวรัสในขณะเดียวกันก็สำรองในสถานที่แยกต่างหากอุปกรณ์และอื่น ๆการมีข้อมูลที่ถูกบีบอัดก่อนการสำรองข้อมูลจะช่วยประหยัดเวลาและเงิน

ระบบที่ใช้ข้อมูลซ้ำซ้อนในการจัดเก็บข้อมูลของพวกเขาสามารถทำงานได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้นพวกเขาจะยังคงต้องมีการขยายเป็นระยะเพื่อรองรับข้อมูลใหม่และเพื่อจัดการกับข้อกังวลเกี่ยวกับความปลอดภัย แต่พวกเขาควรมีแนวโน้มที่จะเติมข้อมูลที่ซ้ำซ้อนน้อยลงอย่างรวดเร็วนี่เป็นข้อกังวลที่พบบ่อยโดยเฉพาะอย่างยิ่งในเซิร์ฟเวอร์อีเมลที่เซิร์ฟเวอร์อาจเก็บข้อมูลจำนวนมากสำหรับผู้ใช้และชิ้นส่วนที่สำคัญของมันอาจประกอบด้วยซ้ำเช่นไฟล์แนบเดียวกันซ้ำแล้วซ้ำอีกตัวอย่างเช่นหลายคนที่ส่งอีเมลจากที่ทำงานมีส่วนท้ายพร้อมกับข้อจำกัดความรับผิดชอบอีเมลและโลโก้ของ บริษัท และสิ่งเหล่านี้สามารถกินพื้นที่เซิร์ฟเวอร์ได้อย่างรวดเร็ว