Internet

Apa itu kompresi data lossless?

Kompresi Data Lossless adalah metode komputer untuk menyimpan file dan menggabungkannya ke dalam arsip yang membutuhkan lebih sedikit ruang fisik dalam memori daripada file yang seharusnya tanpa kehilangan informasi apa pun yang berisi data dalam proses tersebut.Kompresi lossy, sebaliknya, mengurangi ukuran file dengan perkiraan data, dan restorasi adalah faksimili dekat dengan konten file asli.Algoritma yang digunakan untuk kompresi data lossless pada dasarnya adalah seperangkat aturan yang ramping atau instruksi untuk menyandikan informasi menggunakan lebih sedikit bit memori sambil tetap mempertahankan kemampuan untuk mengembalikan data ke format aslinya tanpa perubahan.

Beberapa jenis file umum yang menggunakan data lossless losslessKompresi meliputi ZIP berbasis Komputer International Business Machines (IBM) dan arsip file GZIP berbasis komputer UNIX.Juga digunakan adalah format file gambar seperti grafis interchange format (GIF), portable network graphics (PNG), dan file bitmap (BMP).Algoritma kompresi data juga bervariasi berdasarkan jenis file yang sedang dikompresi, dengan variasi umum untuk file teks, audio, dan program yang dapat dieksekusi.

Dua kategori utama algoritma untuk kompresi data lossless didasarkan pada model statistik data input dan model pemetaan string bit dalam file data.Algoritma statistik rutin yang digunakan adalah Burrows-Wheeler Transform (BWT), Algoritma Abraham Lempel dan Jacob Ziv (LZ77) yang diterbitkan pada tahun 1977, dan metode prediksi dengan pencocokan parsial (ppm).Algoritma pemetaan yang sering digunakan termasuk algoritma pengkodean Huffman dan pengkodean aritmatika.

Beberapa algoritma kompresi data lossless adalah alat sumber terbuka dan yang lain adalah milik dan dipatenkan, meskipun paten pada beberapa juga sekarang telah kedaluwarsa.Ini dapat mengakibatkan metode kompresi kadang -kadang diterapkan pada format file yang salah.Karena fakta bahwa metode kompresi data tertentu tidak sesuai satu sama lain, menyimpan file campuran sering dapat menurunkan komponen file.Misalnya, file gambar dengan teks yang dikompresi dapat menunjukkan degradasi dalam keterbacaan teks yang pernah dipulihkan.Pemindai dan perangkat lunak yang menggunakan induksi tata bahasa dapat mengekstraksi makna dari teks yang disimpan bersama dengan file gambar dengan menerapkan apa yang dikenal sebagai analisis semantik laten (LSA).

Bentuk lain dari metode algoritma pemetaan untuk kompresi data lossless adalah penggunaan kode universal.Lebih fleksibel untuk digunakan daripada pengkodean Huffman, itu tidak memerlukan pengetahuan tentang nilai integer maksimum sebelumnya.Namun, pengkodean Huffman dan pengkodean aritmatika menghasilkan tingkat kompresi data yang lebih baik.Upaya juga dilakukan untuk menghasilkan metode kompresi data universal yang akan menciptakan algoritma yang bekerja dengan baik untuk berbagai sumber.