Skip to main content

Cos'è la deduplicazione?

La deduplicazione è un processo utilizzato per eliminare i dati ridondanti.Durante il processo, il disco rigido di un computer viene scansionato per grandi sequenze di dati su Windows di confronto.Durante la scansione per dati duplicati, in genere vengono scelte sequenze di otto kilobyte o più.Se la sequenza si trova altrove sul sistema di archiviazione, il file duplicato viene referenziato piuttosto che memorizzato di nuovo.

Una deduplicazione di successo può eliminare diversi kilobyte di dati su un computer, portando a ovvi vantaggi.La duplicazione dei dati occupa spazio non necessario nel sistema e quando vengono rimossi i dati estranei, questo lascia all'utente più spazio di archiviazione sul computer.Ciò consentirà al sistema di funzionare più velocemente ed efficiente perché non è impantanato con i dati extra.Inoltre, il miglioramento della larghezza di banda è sempre più evidente quando un computer ha più spazio libero.

La deduplicazione comporta il riferimento alla grande quantità di dati alla prima posizione ed eliminare le copie extra dei dati, che sono, tuttavia, indicizzati nel caso in cui debbano esserenecessario.Spesso, gli stessi dati esatti possono essere archiviati in ben 100 posti diversi su un disco rigido.Se ognuno occupa un megabyte di spazio, la deduplicazione ridurrà questo spazio sul disco rigido da 100 megabyte a uno solo.Il processo funziona archiviando i dati e lo spazio aggiuntivo ottenuto è molto utile per il disco rigido di un computer.

Come i requisiti di potenza, spazio e di raffreddamento, ripristinando un livello di servizio più elevato, eliminando molti diversi tipi di errori e recupero dati in diversi punti.Uno svantaggio della deduplicazione è che identifica i dati duplicati utilizzando le funzioni di hash crittografiche, che possono essere inaffidabili e una collisione o un altro tipo di errore comporterebbe la perdita di dati.Inoltre, se la persona che ha autorizzato la procedura non è a conoscenza della riduzione della ridondanza coinvolta, l'affidabilità del computer può essere influenzata negativamente. La deduplicazione dei dati funziona segmentando prima ogni dato elaborato.Ogni segmento viene identificato e confrontato con i dati già nel sistema.Se i dati sono unici, vengono archiviati su un disco.Se si tratta di un dato duplicato, viene invece creato un riferimento.La deduplicazione può essere implementata utilizzando il software chiamato Data Domain, che funziona con i dati e i sistemi di archiviazione per filtrare tramite dati, referenziazione, eliminazione o memorizzazione di ciascun byte, a seconda dei casi.