Skip to main content

Qu'est-ce que la déduplication des données?

La déduplication des données est une technique de compression des données où les données en double sont supprimées, en maintenant une copie de chaque unité d'information sur un système plutôt que de permettre aux multiples de prospérer.Les copies conservées ont des références permettant au système de les récupérer.Cette technique réduit le besoin d'espace de stockage et peut maintenir plus rapidement les systèmes en plus de limiter les dépenses associées au stockage des données.Il peut fonctionner de plusieurs façons et est utilisé sur de nombreux types de systèmes informatiques.

Dans la déduplication des données au niveau du fichier, le système recherche tous les fichiers dupliqués et supprime les extras.La déduplication au niveau du bloc examine les blocs de données dans les fichiers pour identifier les données étrangères.Les gens peuvent se retrouver avec des données doublées pour une grande variété de raisons, et l'utilisation de la déduplication des données peut rationaliser un système, ce qui facilite l'utilisation.Le système peut périodiquement passer à travers les données pour vérifier les doublons, éliminer les extras et générer des références pour les fichiers laissés.

Ces systèmes sont parfois appelés systèmes de compression intelligents ou systèmes de stockage à instance unique.Les deux termes font référence à l'idée que le système fonctionne intelligemment pour stocker et déposer des données afin de réduire la charge sur le système.La déduplication des données peut être particulièrement précieuse avec de grands systèmes où les données d'un certain nombre de sources sont stockées et les coûts de stockage sont constamment en hausse, car le système doit être élargi au fil du temps.

Ces systèmes sont conçus pour faire partie d'un système plus grandpour comprimer et gérer les données.équipement, et ainsi de suite.La compression des données avant sauvegardera le temps et l'argent.

Les systèmes utilisant la déduplication des données dans leur stockage peuvent fonctionner plus rapidement et efficacement.Ils auront toujours besoin d'une expansion périodique pour s'adapter à de nouvelles données et pour répondre aux préoccupations concernant la sécurité, mais ils devraient être moins enclins à remplir rapidement des données dupliquées.Il s'agit d'une préoccupation particulièrement courante sur les serveurs de messagerie, où le serveur peut stocker de grandes quantités de données pour les utilisateurs et des morceaux importants pourraient être constitués de doublons comme les mêmes pièces jointes répétées encore et encore;Par exemple, de nombreuses personnes par e-mail par e-mail au travail ont joint des pieds avec des avertissements par e-mail et des logos d'entreprise, et ceux-ci peuvent manger rapidement un espace de serveur.