Skip to main content

Hva er deduplisering?

Deduplisering er en prosess som brukes til å eliminere overflødige data.Under prosessen skannes en datamaskinens harddisk for store sekvenser av data på tvers av sammenligningsvinduer.Mens du skanner etter duplikatdata, blir sekvenser på åtte kilobyter eller mer vanligvis plukket ut.Hvis sekvensen finnes andre steder på lagringssystemet, refereres den dupliserte filen i stedet for lagret igjen.

En vellykket deduplisering kan eliminere flere kilobyter med data på en datamaskin, noe som fører til åpenbare fordeler.Data duplisering tar unødvendig rom i systemet, og når ekstern data fjernes, etterlater dette brukeren mer lagringsplass på datamaskinen.Dette vil tillate systemet å løpe raskere og mer effektivt fordi det ikke er fastet med ekstra data.I tillegg er forbedring av båndbredde alltid mer merkbar når en datamaskin har mer ledig plass.

Deduplisering innebærer å referere til den store mengden data til det første stedet og slette de ekstra kopiene av dataene, som imidlertid er indeksert i tilfelle de skal værebehov for.Ofte kan de samme eksakte dataene lagres på så mange som 100 forskjellige steder på en harddisk.Hvis hver tar opp en megabyte plass, vil deduplisering redusere denne plassen på harddisken fra 100 megabyte til bare en.Prosessen fungerer ved å arkivere dataene, og den ekstra plassen som oppnås er veldig gunstig for datamaskinens harddisk.

som kraft, rom og kjølingskrav, gjenopprette et høyere servicenivå, eliminerer mange forskjellige typer feil og gjenvinner data på flere forskjellige punkter.En ulempe med deduplisering er at de identifiserer duplikatdataene ved bruk av kryptografiske hashfunksjoner, som kan være upålitelige, og en kollisjon eller annen type feil vil resultere i tap av data.Hvis personen som autoriserte prosedyren ikke er klar over reduksjonsreduksjonen som er involvert, kan datamaskinens pålitelighet påvirkes negativt. Data deduplication fungerer ved å først segmentere hvert stykke data som blir behandlet.Hvert segment blir identifisert og sammenlignet med data som allerede er i systemet.Hvis dataene er unike, lagres de på en disk.Hvis det er et duplikat stykke data, opprettes en referanse i stedet.Deduplisering kan implementeres ved hjelp av programvare kalt Data Domain, som fungerer med data og lagringssystemer for å filtrere gjennom data, referere, eliminere eller lagre hver byte, etter behov.