Qu'est-ce que la déduplication des données?

La déduplication des données est une technique de compression des données dans laquelle les données en double sont supprimées, en conservant une copie de chaque unité d'informations sur un système plutôt que de permettre aux multiples de prospérer. Les copies conservées ont des références permettant au système de les récupérer. Cette technique réduit le besoin d'espace de stockage et permet aux systèmes de fonctionner plus rapidement en plus de limiter les dépenses associées au stockage de données. Il peut fonctionner de différentes manières et est utilisé sur de nombreux types de systèmes informatiques.

Dans la déduplication de données au niveau fichier, le système recherche les fichiers dupliqués et supprime les extras. La déduplication au niveau des blocs examine les blocs de données dans les fichiers pour identifier les données superflues. Les personnes peuvent se retrouver avec des données doublées pour une grande variété de raisons, et l'utilisation de la déduplication des données peut rationaliser un système, en le rendant plus facile à utiliser. Le système peut parcourir périodiquement les données pour vérifier les doublons, éliminer les extras et générer des références pour les fichiers laissés.

De tels systèmes sont parfois appelés systèmes de compression intelligents ou systèmes de stockage à instance unique. Les deux termes font référence à l'idée que le système fonctionne intelligemment pour stocker et archiver des données afin de réduire la charge sur le système. La déduplication des données peut être particulièrement utile avec les grands systèmes où les données de plusieurs sources sont stockées et où les coûts de stockage sont en augmentation constante, car le système doit être étendu au fil du temps.

Ces systèmes sont conçus pour faire partie d’un système plus vaste de compression et de gestion des données. La déduplication des données ne peut pas protéger les systèmes contre les virus et les erreurs. Il est donc important d’utiliser une protection antivirus adéquate pour protéger un système et limiter la contamination virale des fichiers, tout en effectuant une copie de sauvegarde dans un autre lieu afin de résoudre les problèmes de perte de données due à des équipement, et ainsi de suite. La compression des données avant la sauvegarde vous fera gagner du temps et de l'argent.

Les systèmes utilisant la déduplication des données dans leur stockage peuvent fonctionner plus rapidement et plus efficacement. Ils nécessiteront toujours une extension périodique pour prendre en compte les nouvelles données et résoudre les problèmes de sécurité, mais ils devraient être moins enclins à se remplir rapidement avec des données dupliquées. Il s'agit d'une préoccupation particulièrement courante sur les serveurs de messagerie, où le serveur peut stocker de grandes quantités de données pour les utilisateurs et dont une partie importante peut être constituée de doublons, tels que les mêmes pièces jointes répétées. Par exemple, de nombreuses personnes envoyant des courriels au travail ont des pieds de page avec des renonciations par courrier électronique et des logos de société, qui peuvent occuper rapidement l’espace serveur.

Qu'est-ce que la déduplication des données?

Cet article vous a‑t‑il été utile ?