Skip to main content

Apa itu deduplikasi data?

Data deduplikasi adalah teknik untuk mengompresi data di mana data duplikat dihapus, memelihara satu salinan dari setiap unit informasi pada suatu sistem daripada memungkinkan kelipatan berkembang.Salinan yang disimpan memiliki referensi yang memungkinkan sistem untuk mengambilnya.Teknik ini mengurangi kebutuhan ruang penyimpanan dan dapat menjaga sistem berjalan lebih cepat selain membatasi biaya yang terkait dengan penyimpanan data.Ini dapat bekerja dalam beberapa cara dan digunakan pada banyak jenis sistem komputer.

Dalam deduplikasi data tingkat file, sistem mencari file yang digandakan dan menghapus ekstra.Deduplikasi level blok melihat blok data dalam file untuk mengidentifikasi data asing.Orang dapat berakhir dengan data dua kali lipat karena berbagai alasan, dan menggunakan deduplikasi data dapat merampingkan sistem, membuatnya lebih mudah digunakan.Sistem ini dapat secara berkala meneliti data untuk memeriksa duplikat, menghilangkan ekstra, dan menghasilkan referensi untuk file yang tertinggal.

Sistem seperti itu kadang-kadang disebut sebagai sistem kompresi cerdas, atau sistem penyimpanan tunggal.Kedua istilah merujuk gagasan bahwa sistem bekerja secara cerdas untuk menyimpan dan mengajukan data untuk mengurangi beban pada sistem.Deduplikasi data dapat sangat berharga dengan sistem besar di mana data dari sejumlah sumber disimpan dan biaya penyimpanan terus meningkat, karena sistem perlu diperluas dari waktu ke waktu.

Sistem ini dirancang untuk menjadi bagian dari sistem yang lebih besaruntuk mengompresi dan mengelola data.Deduplikasi data tidak dapat melindungi sistem dari virus dan kesalahan, dan penting untuk menggunakan perlindungan antivirus yang memadai untuk menjaga sistem tetap aman dan membatasi kontaminasi virus file sementara juga dicadangkan di lokasi terpisah untuk mengatasi masalah tentang kehilangan data karena pemadaman, kerusakanperalatan, dan sebagainya.Memiliki data yang dikompresi sebelum dicadangkan akan menghemat waktu dan uang.

Sistem menggunakan deduplikasi data dalam penyimpanan mereka dapat berjalan lebih cepat dan efisien.Mereka masih akan membutuhkan ekspansi berkala untuk mengakomodasi data baru dan untuk mengatasi kekhawatiran tentang keamanan, tetapi mereka harus kurang rentan untuk diisi dengan cepat dengan data yang digandakan.Ini adalah perhatian yang sangat umum pada server email, di mana server dapat menyimpan data dalam jumlah besar untuk pengguna dan potongan yang signifikan dapat terdiri dari duplikat seperti lampiran yang sama yang diulang berulang kali;Misalnya, banyak orang yang mengirim email dari pekerjaan telah melampirkan footer dengan penafian email dan logo perusahaan, dan ini dapat memakan ruang server dengan cepat.