Skip to main content

Co je beztrátová komprese dat?

Bezztrátová komprese dat je počítačová metoda pro ukládání souborů a jejich kombinace do archivů, které zabírají méně fyzického prostoru v paměti, než by soubory jinak, aniž by ztratily jakékoli informace, které data obsahují v procesu.Ztráta komprese naopak snižuje velikost souboru s aproximací dat a obnova je blízkém faxovým obsahem původního obsahu souboru.Algoritmy používané pro bezchybnou kompresi dat jsou v podstatě sada efektivních pravidel nebo pokynů pro kódování informací pomocí méně kousků paměti a přitom si stále zachovávají schopnost obnovit data do původního formátu bez změny.Komprese zahrnuje počítačové počítačové ZIP a počítačové archivy souborů GZIP založené na mezinárodních obchodních strojích (IBM).Používají se také formáty obrazových souborů, jako je soubory grafické výměny (GIF), přenosná síťová grafika (PNG) a bitmap (BMP).Algoritmy komprese dat se také liší v závislosti na komprimovaném typu souboru, s běžnými varianty pro textové, zvukové a spustitelné programové soubory.

Dvě hlavní kategorie algoritmů pro bezeztrátové komprese dat jsou založeny na statistickém modelu vstupních dat a mapovacího modelu bitových řetězců v datovém souboru.Použité rutinní statistické algoritmy jsou burrows-wheeler Transform (BWT), Abraham Lempel a Jacob ZIV (LZ77) publikovaný v roce 1977 a predikce částečným shodou (PPM).Mezi často používané algoritmy mapování patří algoritmus kódování Huffman a aritmetické kódování.To může vést k tomu, že se metody komprese někdy aplikují na nesprávný formát souboru.Vzhledem k tomu, že některé metody komprese dat jsou mezi sebou nekompatibilní, může ukládat smíšené soubory často degradovat součást souboru.Například obrazový soubor s komprimovaným textem může po obnovení zobrazit degradaci v čitelnosti textu.Skenery a software, které používají indukci gramatiky, mohou extrahovat význam z textu uloženého spolu s obrazovými soubory použitím, co se nazývá latentní sémantická analýza (LSA).Flexibilnější pro použití než Huffman kódování, nevyžaduje znalost maximálních celočíselných hodnot v předem.Huffman kódování a aritmetické kódování však vytvářejí lepší míru komprese dat.Probíhá také úsilí o výrobu univerzálních metod komprese dat, které by vytvářely algoritmy, které dobře fungují pro různé zdroje.