Skip to main content

Vad är deduplicering?

Deduplication är en process som används för att eliminera redundanta data.Under processen skannas en dators hårddisk för stora sekvenser av data över jämförelsefönster.När du skannar efter duplicerade data plockas vanligtvis sekvenser av åtta kilobyte eller mer ut.Om sekvensen finns någon annanstans i lagringssystemet hänvisas den duplicerade filen snarare än lagras igen.

En framgångsrik deduplicering kan eliminera flera kilobyte data på en dator, vilket leder till uppenbara fördelar.Data duplicering tar onödigt rum i systemet, och när främmande data tas bort lämnar detta användaren med mer lagringsutrymme på datorn.Detta gör att systemet kan köra snabbare och mer effektivt eftersom det inte är fastnat med extra data.Dessutom är förbättring av bandbredd alltid mer märkbar när en dator har mer ledigt utrymme.

Deduplicering innebär att de hänvisar till den stora mängden data till den första platsen och raderar de extra kopiorna av data, som emellertid indexeras om de borde varabehövs.Ofta kan samma exakta data lagras på så många som 100 olika platser på en hårddisk.Om var och en tar upp en megabyte av rymden kommer deduplicering att minska detta utrymme på hårddisken från 100 megabyte till bara en.Processen fungerar genom att arkivera uppgifterna, och det extra utrymmet som erhålls är mycket fördelaktigt för en dators hårddisk.

Ytterligare fördelar med deduplicering inkluderar att minska mängden back-up-utrymme som behövs av så mycket som 90 procent, vilket minskar kostnadernasåsom kraft, utrymme och kylningskrav, återställa en högre servicenivå, eliminera många olika typer av fel och återställa data på flera olika punkter.En nackdel med deduplicering är att den identifierar duplikatdata med hjälp av kryptografiska hashfunktioner, som kan vara opålitliga, och en kollision eller annan typ av fel skulle resultera i förlust av data.Om personen som godkände förfarandet inte är medveten om den inblandade reduktionen kan datorns tillförlitlighet påverkas negativt.

Data deduplicering fungerar genom att först segmentera varje data som behandlas.Varje segment identifieras och jämförs med data som redan finns i systemet.Om data är unika lagras de på en disk.Om det är en duplikat data skapas en referens istället.Deduplicering kan implementeras med hjälp av programvara som kallas datadomän, som fungerar med data och lagringssystem för att filtrera genom data, referens, eliminera eller lagra varje byte, i förekommande fall.