Skip to main content

Hvad er deduplikation?

Deduplikation er en proces, der bruges til at eliminere overflødige data.Under processen scannes en computers harddisk for store sekvenser af data på tværs af sammenligningsvinduer.Mens scanning efter duplikatdata, vælges sekvenser af otte kilobyte eller mere typisk.Hvis sekvensen findes andre steder på lagringssystemet, henvises den duplikerede fil snarere end gemt igen.

En vellykket deduplikation kan eliminere flere kilobyte data på en computer, hvilket fører til åbenlyse fordele.Dato duplikation tager unødvendigt rum i systemet, og når fremmede data fjernes, efterlader dette brugeren mere lagerplads på computeren.Dette giver systemet mulighed for at køre hurtigere og mere effektivt, fordi det ikke er forkælet med de ekstra data.Derudover er forbedring af båndbredde altid mere mærkbar, når en computer har mere fri plads.

Deduplikation involverer at henvise til den store mængde data til det første sted og slette de ekstra kopier af dataene, som dog indekseres i tilfælde af, at de skulle værehavde brug for.Ofte kan de samme nøjagtige data gemmes på så mange som 100 forskellige steder på en harddisk.Hvis hver optager en megabyte af rummet, vil deduplikation reducere denne plads på harddisken fra 100 megabyte til kun en.Processen fungerer ved at arkivere dataene, og den ekstra plads, der opnås, er meget gavnlig for en computers harddisk.

Yderligere fordele ved deduplikation inkluderer at reducere den mængde sikkerhedskopisåsom krav til strøm, plads og køling, gendannelse af et højere serviceniveau, eliminering af mange forskellige slags fejl og gendannelse af data på flere forskellige punkter.En ulempe ved deduplikation er, at den identificerer duplikatdataene ved hjælp af kryptografiske hashfunktioner, som kan være upålidelige, og en kollision eller anden type fejl ville resultere i tab af data.Hvis den person, der godkendte proceduren, ikke er opmærksom på den involverede redundansreduktion, kan computerens pålidelighed påvirkes negativt.

Data -deduplikation fungerer ved først at segmentere hvert stykke data, der behandles.Hvert segment identificeres og sammenlignes med data, der allerede er i systemet.Hvis dataene er unikke, gemmes de på en disk.Hvis det er et duplikat stykke data, oprettes en reference i stedet.Deduplikation kan implementeres ved hjælp af softwaredomæne, der fungerer med data og lagringssystemer til at filtrere gennem data, henvisning, eliminering eller lagring af hver byte, efter behov.