Skip to main content

ロスレスデータ圧縮とは何ですか?

レスレスデータ圧縮は、ファイルを保存し、ファイルをメモリ内の物理的なスペースを占めるアーカイブに組み合わせて、ファイルがプロセスに含まれる情報を失うことなく、メモリ内の物理的なスペースを占めるアーカイブに結合するコンピューター方法です。対照的に、喪失した圧縮は、データの近似でファイルサイズを縮小し、復元は元のファイルの内容に近いものです。ロスレスデータ圧縮に使用されるアルゴリズムは、本質的に、メモリの少ないビットを使用して情報をエンコードするための合理化されたルールまたは指示のセットです。圧縮には、国際ビジネスマシン(IBM)コンピューターベースのZIPおよびUNIXコンピューターベースのGZIPファイルアーカイブが含まれます。また、グラフィックインターチェンジ形式(GIF)、ポータブルネットワークグラフィックス(PNG)、ビットマップ(BMP)ファイルなどの画像ファイル形式も使用されます。データ圧縮アルゴリズムは、テキスト、オーディオ、および実行可能なプログラムファイルの一般的なバリエーションがあるファイルタイプに基づいて異なります。losslessロスレスデータ圧縮のアルゴリズムの2つの主要なカテゴリは、入力データの統計モデルとデータファイル内のビット文字列のマッピングモデルに基づいています。使用されるルーチンの統計アルゴリズムは、1977年に公開された巣穴輪変換(BWT)、アブラハムレンペルおよびジェイコブZIV(LZ77)アルゴリズム、および部分的マッチング(PPM)メソッドによる予測です。頻繁に採用されるマッピングアルゴリズムには、ハフマンコーディングアルゴリズムと算術コーディングが含まれます。これにより、間違ったファイル形式に圧縮方法が適用される場合があります。特定のデータ圧縮方法が互いに互換性がないという事実により、混合ファイルを保存すると、ファイルのコンポーネントを劣ることがよくあります。たとえば、圧縮されたテキストを含む画像ファイルは、復元されたテキストの読みやすさに劣化を示すことができます。文法誘導を採用するスキャナーとソフトウェアは、潜在セマンティック分析(LSA)と呼ばれるものを適用することにより、画像ファイルとともに保存されたテキストから意味を抽出できます。Huffmanコーディングよりも柔軟に使用でき、最大の整数値の知識は事前に必要としません。ただし、Huffmanのコーディングと算術コーディングは、より良いデータ圧縮率を生成します。また、さまざまなソースに適したアルゴリズムを作成する普遍的なデータ圧縮方法を作成する努力も進行中です。