Skip to main content

Apa itu deduplikasi?

Deduplikasi adalah proses yang digunakan untuk menghilangkan data yang berlebihan.Selama proses tersebut, hard drive komputer dipindai untuk urutan data yang besar di seluruh jendela perbandingan.Sementara pemindaian untuk data duplikat, urutan delapan kilobyte atau lebih biasanya dipilih.Jika urutan ditemukan di tempat lain pada sistem penyimpanan, file yang digandakan dirujuk daripada disimpan lagi.

Deduplikasi yang berhasil dapat menghilangkan beberapa kilobyte data pada komputer, yang mengarah ke manfaat yang jelas.Duplikasi data mengambil ruang yang tidak perlu dalam sistem, dan ketika data asing dihapus, ini membuat pengguna dengan lebih banyak ruang penyimpanan di komputer.Ini akan memungkinkan sistem untuk berjalan lebih cepat dan lebih efisien karena tidak macet dengan data tambahan.Selain itu, perbaikan bandwidth selalu lebih terlihat ketika komputer memiliki lebih banyak ruang bebas.

Deduplikasi melibatkan referensi dalam jumlah besar data ke lokasi pertama dan menghapus salinan tambahan data, yang, bagaimanapun, diindeks jika mereka seharusnyadiperlukan.Seringkali, data yang sama persis dapat disimpan dalam sebanyak 100 tempat berbeda pada hard drive.Jika masing -masing mengambil satu megabyte ruang, deduplikasi akan mengurangi ruang ini pada hard drive dari 100 megabyte menjadi hanya satu.Proses ini bekerja dengan mengarsipkan data, dan ruang tambahan yang diperoleh sangat bermanfaat untuk hard drive komputer.

Manfaat tambahan dari deduplikasi termasuk mengurangi jumlah ruang cadangan yang dibutuhkan sebanyak 90 persen, mengurangi biaya penguranganSeperti persyaratan daya, ruang dan pendinginan, memulihkan tingkat layanan yang lebih tinggi, menghilangkan berbagai jenis kesalahan dan memulihkan data di beberapa titik berbeda.Kelemahan deduplikasi adalah bahwa ia mengidentifikasi data duplikat menggunakan fungsi hash kriptografi, yang mungkin tidak dapat diandalkan, dan tabrakan atau jenis kesalahan lainnya akan mengakibatkan hilangnya data.Juga, jika orang yang mengesahkan prosedur tidak mengetahui pengurangan redundansi yang terlibat, keandalan komputer dapat terpengaruh secara negatif.

Data deduplikasi berfungsi dengan terlebih dahulu membagi setiap bagian data yang diproses.Setiap segmen diidentifikasi dan dibandingkan dengan data yang sudah ada dalam sistem.Jika data unik, disimpan pada disk.Jika itu adalah duplikat data, referensi dibuat sebagai gantinya.Deduplikasi dapat diimplementasikan menggunakan perangkat lunak yang disebut Data Domain, yang berfungsi dengan data dan sistem penyimpanan untuk memfilter data, merujuk, menghilangkan atau menyimpan setiap byte, sebagaimana mestinya.