Skip to main content

Qu'est-ce que la déduplication?

La déduplication est un processus utilisé pour éliminer les données redondantes.Au cours du processus, le disque dur d'un ordinateur est scanné pour les grandes séquences de données à travers les fenêtres de comparaison.Lors de la numérisation des données en double, des séquences de huit kilobytes ou plus sont généralement sélectionnées.Si la séquence est trouvée ailleurs sur le système de stockage, le fichier dupliqué est référencé plutôt que stocké à nouveau.

Une déduplication réussie peut éliminer plusieurs kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-kilo-prestations, conduisant à des avantages évidents.La duplication de données occupe une pièce inutile du système et lorsque des données étrangères sont supprimées, cela laisse l'utilisateur avec plus d'espace de stockage sur l'ordinateur.Cela permettra au système d'exécuter plus rapidement et plus efficacement car il n'est pas enlisé avec les données supplémentaires.De plus, l'amélioration de la bande passante est toujours plus visible lorsqu'un ordinateur a plus d'espace libre.

La déduplication implique de référencer la grande quantité de données au premier emplacement et de supprimer les copies supplémentaires des données, qui sont cependant indexées au cas où elles devraient êtrenécessaire.Souvent, les mêmes données exactes peuvent être stockées dans jusqu'à 100 endroits différents sur un disque dur.Si chacun occupe un mégaoctet d'espace, la déduplication réduira cet espace sur le disque dur de 100 mégaoctets à un seul.Le processus fonctionne en archivant les données, et l'espace supplémentaire acquis est très bénéfique pour le disque dur d'un ordinateur.

Les avantages supplémentaires de la déduplication comprennent la réduction de la quantité d'espace de secours nécessaire à 90%, la réduction des coûtstels que les exigences de puissance, d'espace et de refroidissement, restaurant un niveau de service plus élevé, éliminant de nombreux types d'erreurs et récupérant des données à plusieurs points différents.Un inconvénient de la déduplication est qu'il identifie les données en double utilisant des fonctions de hachage cryptographique, qui peuvent être peu fiables, et une collision ou un autre type d'erreur entraînerait la perte de données.De plus, si la personne qui a autorisé la procédure n'est pas consciente de la réduction de la redondance impliquée, la fiabilité de l'ordinateur peut être affectée négativement.

La déduplication des données fonctionne en segmentant d'abord chaque élément de données traité.Chaque segment est identifié et comparé aux données déjà dans le système.Si les données sont uniques, elles sont stockées sur un disque.S'il s'agit d'un élément de données en double, une référence est créée à la place.La déduplication peut être implémentée à l'aide d'un logiciel appelé Data Domain, qui fonctionne avec les données et les systèmes de stockage pour filtrer les données, la référence, l'élimination ou le stockage de chaque octet, le cas échéant.