Skip to main content

Co to jest deduplikacja?

Deduplikacja jest procesem używanym do wyeliminowania zbędnych danych.Podczas procesu dysku twardego komputera jest skanowany w przypadku dużych sekwencji danych w różnych systemach Windows.Podczas skanowania pod kątem zduplikowanych danych, zwykle wybierane są sekwencje ośmiu kilobajtów lub więcej.Jeśli sekwencja zostanie znaleziona w innym miejscu systemu pamięci, odwołany jest powtórny plik, a nie ponownie przechowywany.

Udana deduplikacja może wyeliminować kilka kilobajtów danych na komputerze, co prowadzi do oczywistych korzyści.Duplikacja danych zajmuje niepotrzebne miejsce w systemie, a po usunięciu danych obcych pozostawia użytkownikowi więcej miejsca do przechowywania na komputerze.Umożliwi to systemowi działanie szybciej i wydajniej, ponieważ nie jest wrzucony dodatkowymi danymi.Ponadto poprawa przepustowości jest zawsze bardziej zauważalna, gdy komputer ma więcej wolnego miejsca.

deduplikacja polega na odwołaniu dużej ilości danych do pierwszej lokalizacji i usunięciu dodatkowych kopii danych, które są jednak indeksowane w przypadku, gdy powinny być indeksowanepotrzebne.Często te same dokładne dane mogą być przechowywane w aż 100 różnych miejscach na dysku twardym.Jeśli każdy zajmie jedną megabajt przestrzeni, deduplikacja zmniejszy to miejsce na dysku twardym ze 100 megabajtów do tylko jednego.Proces działa poprzez archiwizowanie danych, a dodatkowa przestrzeń, która jest uzyskana, jest bardzo korzystna dla dysku twardego komputera.

Dodatkowe korzyści deduplikacji obejmują zmniejszenie ilości miejsca kopii zapasowej potrzebne nawet o 90 procent, zmniejszenie kosztówtakie jak wymagania dotyczące energii, przestrzeni i chłodzenia, przywracanie wyższego poziomu usług, eliminowanie wielu różnych rodzajów błędów i odzyskiwanie danych w kilku różnych punktach.Wadą deduplikacji jest to, że identyfikuje zduplikowane dane za pomocą funkcji skrótu kryptograficznego, które mogą być zawodne, a zderzenie lub inny rodzaj błędu spowodowałby utratę danych.Ponadto, jeśli osoba, która autoryzowała tę procedurę, nie jest świadoma redundowności, może mieć negatywny wpływ na niezawodność komputera.

Dane deduplikacja działa poprzez pierwszą segmentowanie każdego przetwarzanego danych.Każdy segment jest identyfikowany i porównany z danymi, które są już w systemie.Jeśli dane są unikalne, są przechowywane na dysku.Jeśli jest to duplikat danych, zamiast tego tworzone jest odniesienie.Deduplikacja można zaimplementować przy użyciu oprogramowania o nazwie Data Domain, które działa z danych i systemami pamięci do filtrowania danych, odwołania, eliminowania lub przechowywania każdego bajtu, odpowiednio.