Skip to main content

Wat is deduplicatie?

Deduplicatie is een proces dat wordt gebruikt om redundante gegevens te elimineren.Tijdens het proces wordt de harde schijf van een computer gescand op grote reeksen gegevens in vergelijkingsvensters.Hoewel het scannen op dubbele gegevens, worden sequenties van acht kilobytes of meer meestal uitgekozen.Als de volgorde elders op het opslagsysteem wordt gevonden, wordt naar het gedupliceerde bestand verwezen in plaats van opnieuw opgeslagen.

Een succesvolle deduplicatie kan verschillende kilobytes gegevens op een computer elimineren, wat leidt tot voor de hand liggende voordelen.Gegevensduplicatie neemt onnodige ruimte in het systeem in beslag, en wanneer externe gegevens worden verwijderd, laat de gebruiker de gebruiker meer opslagruimte op de computer.Hierdoor kan het systeem sneller en efficiënter worden uitgevoerd omdat het niet vastzit met de extra gegevens.Bovendien is de verbetering van de bandbreedte altijd meer merkbaar wanneer een computer meer vrije ruimte heeft.

Deduplicatie omvat het verwijzen naar de grote hoeveelheid gegevens naar de eerste locatie en het verwijderen van de extra kopieën van de gegevens, die echter worden geïndexeerd voor het geval ze moeten zijn in het geval dat ze moeten zijn in het gevalnodig zijn.Vaak kunnen dezelfde exacte gegevens worden opgeslagen op maar liefst 100 verschillende plaatsen op een harde schijf.Als elk een megabyte van ruimte inneemt, zal de deduplicatie deze ruimte op de harde schijf verminderen van 100 megabytes tot slechts één.zoals stroom-, ruimte- en koelvereisten, het herstellen van een hoger serviceniveau, het elimineren van veel verschillende soorten fouten en het herstellen van gegevens op verschillende punten.Een nadeel van deduplicatie is dat het de dubbele gegevens identificeert met behulp van cryptografische hashfuncties, die onbetrouwbaar kunnen zijn, en een botsing of een ander type fouten zou leiden tot het verlies van gegevens.Ook als de persoon die de procedure heeft geautoriseerd, niet op de hoogte is van de betrokken redundantie -reductie, kan de betrouwbaarheid van de computer nadelig worden beïnvloed.

Deduplicatie van gegevens werkt door eerst elk stuk gegevens te segmenteren dat wordt verwerkt.Elk segment wordt geïdentificeerd en vergeleken met gegevens die zich al in het systeem bevinden.Als de gegevens uniek zijn, wordt deze op een schijf opgeslagen.Als het een dubbele gegevens is, wordt in plaats daarvan een referentie gemaakt.Deduplicatie kan worden geïmplementeerd met behulp van software genaamd Data Domain, die werkt met gegevens en opslagsystemen om gegevens te filteren, het verwijzen, elimineren of opslaan van elke byte, indien van toepassing.