Skip to main content

Cos'è la deduplicazione dei dati?

La deduplicazione dei dati è una tecnica per comprimere i dati in cui vengono eliminati i dati duplicati, mantenendo una copia di ciascuna unità di informazioni su un sistema piuttosto che consentire a multipli di prosperare.Le copie trattenute hanno riferimenti che consentono al sistema di recuperarle.Questa tecnica riduce la necessità di spazio di archiviazione e può far funzionare i sistemi più velocemente oltre a limitare le spese associate all'archiviazione dei dati.Può funzionare in vari modi ed è utilizzato su molti tipi di sistemi informatici.

Nella deduplicazione dei dati a livello di file, il sistema cerca file duplicati ed elimina gli extra.La deduplicazione a livello di blocco esamina blocchi di dati all'interno di file per identificare i dati estranei.Le persone possono finire con dati raddoppiati per un'ampia varietà di motivi e l'utilizzo della deduplicazione dei dati può semplificare un sistema, rendendo più facile l'uso.Il sistema può periodicamente poro attraverso i dati per verificare i duplicati, eliminare gli extra e generare riferimenti per i file lasciati alle spalle.

Tali sistemi sono talvolta indicati come sistemi di compressione intelligenti o sistemi di archiviazione a istanza singola.Entrambi i termini fanno riferimento all'idea che il sistema funzioni in modo intelligente per archiviare e file per ridurre il carico sul sistema.La deduplicazione dei dati può essere particolarmente preziosa con sistemi di grandi dimensioni in cui vengono archiviati i dati provenienti da una serie di fonti e i costi di archiviazione sono costantemente in aumento, poiché il sistema deve essere ampliato nel tempo.

Questi sistemi sono progettati per far parte di un sistema più ampioper comprimere e gestire i dati.La deduplicazione dei dati non può proteggere i sistemi da virus e guasti ed è importante utilizzare un'adeguata protezione antivirus per mantenere un sistema sicuro e limitare la contaminazione virale dei file mentre si esegue il backup in una posizione separata per affrontare le preoccupazioni sulla perdita di dati dovuta a interruzioni, danni a danniattrezzatura e così via.Avere i dati compressi prima del backup farà risparmiare tempo e denaro.

I sistemi che utilizzano la deduplicazione dei dati nella loro memoria possono funzionare in modo più rapido ed efficiente.Richiederanno comunque un'espansione periodica per accogliere nuovi dati e per affrontare le preoccupazioni sulla sicurezza, ma dovrebbero essere meno inclini a riempire rapidamente dati duplicati.Questa è una preoccupazione particolarmente comune sui server di posta elettronica, in cui il server può archiviare grandi quantità di dati per gli utenti e blocchi significativi potrebbero consistere in duplicati come gli stessi allegati ripetuti più e più volte;Ad esempio, molte persone che inviano e -mail dal lavoro hanno allegato piè di pagina con disclaimer e -mail e loghi dell'azienda, e queste possono consumare rapidamente lo spazio del server.