Skip to main content

重複排除とは何ですか?

reduplication冗長データを排除するために使用されるプロセスです。プロセス中に、コンピューターのハードドライブが、比較ウィンドウ全体で大きなデータシーケンスを使用するためにスキャンされます。複製データをスキャンしている間、8つ以上のキロバイト以上のシーケンスが通常選ばれます。シーケンスがストレージシステムの他の場所で見つかった場合、複製されたファイルが再び保存されるのではなく参照されます。データの複製は、システム内の不必要な部屋を占め、外部のデータが削除されると、ユーザーはコンピューター上のストレージスペースを増やします。これにより、システムは追加のデータに迷い込まれていないため、より速く、より効率的に実行できます。さらに、コンピューターのより多くの空き容量がある場合、帯域幅の改善は常に顕著です。必要です。多くの場合、同じデータをハードドライブに100個もの異なる場所に保存できます。それぞれが1メガバイトのスペースを占有する場合、重複排除により、ハードドライブのこのスペースが100メガバイトから1つだけに減少します。このプロセスはデータをアーカイブすることで機能し、獲得される追加スペースはコンピューターのハードドライブにとって非常に有益です。電源、スペース、冷却要件、より高いレベルのサービスを回復し、さまざまな種類のエラーを排除し、いくつかの異なるポイントでデータを回復します。重複排除の欠点は、暗号化ハッシュ関数を使用して重複データを識別することです。これは信頼できない可能性があり、衝突または他のタイプのエラーがデータの損失につながることです。また、手順を承認した人が冗長性の削減を認識していない場合、コンピューターの信頼性が悪影響を受ける可能性があります。各セグメントが識別され、すでにシステムにあるデータと比較されます。データが一意の場合、ディスクに保存されます。重複したデータの場合、代わりに参照が作成されます。重複排除は、データとストレージシステムと連携するソフトウェアを使用して実装できます。データとストレージシステムは、データをフィルタリングし、各バイトを参照、排除、または保存します。