Skip to main content

Co to jest bezstronna kompresja danych?

Bezprzestrzeganie kompresji danych jest komputerową metodą przechowywania plików i łączenia ich w archiwa, które zajmują mniej fizyczną przestrzeń w pamięci niż pliki, bez utraty żadnych informacji, które dane zawierają w procesie.Natomiast utrata kompresji zmniejsza rozmiar pliku wraz z przybliżeniami danych, a przywrócenie jest bliskie do oryginalnej zawartości pliku.Algorytmy używane do kompresji danych bezstratnych są zasadniczo zestawem usprawnionych reguł lub instrukcji kodowania informacji przy użyciu mniejszej liczby bitów pamięci przy jednoczesnym zachowaniu możliwości przywrócenia danych do oryginalnego formatu bez zmian.Kompresja obejmuje komputerowe Międzynarodowe Maszyny Business (IBM) ZIP i komputerowe archiwa plików GZIP oparte na UNIX.Używane są również formaty plików obrazu, takie jak format wymiany graficznej (GIF), przenośna grafika sieciowa (PNG) i pliki Bitmap (BMP).Algorytmy kompresji danych również różnią się w zależności od kompresowanego typu pliku, z powszechnymi wariantami dla plików programu tekstowego, audio i wykonywalnego.Dwie główne kategorie algorytmów dla kompresji danych bezstratnych oparte są na modelu statystycznym danych wejściowych i modelu mapowania ciągów bitów w pliku danych.Rutynowe zastosowane algorytmy statystyczne to algorytm Burrows-Wheeler (BWT), algorytm Abraham Lempel i Jacob Ziv (LZ77) opublikowany w 1977 r., Oraz przewidywanie według częściowego dopasowania (PPM).Często stosowane algorytmy mapowania obejmują algorytm kodowania Huffmana i kodowanie arytmetyczne.

Niektóre z bezstratnych algorytmów kompresji danych są narzędziami open source, a inne są zastrzeżone i opatentowane, chociaż patenty na niektórych również wygasły.Może to spowodować, że metody kompresji są czasami stosowane do niewłaściwego formatu pliku.Ze względu na fakt, że niektóre metody kompresji danych są niezgodne ze sobą, przechowywanie mieszanych plików może często degradować komponent pliku.Na przykład plik obrazu ze skompresowanym tekstem może wyświetlać degradację w czytelności tekstu po przywróceniu.Skanery i oprogramowanie, które wykorzystują indukcję gramatyczną, mogą wyodrębnić znaczenie z tekstu przechowywanego wraz z plikami obrazów, stosując tak zwaną analizę semantyczną (LSA).

Inną formą metody algorytmu mapowania dla kompresji danych bezstratnych jest użycie kodu uniwersalnego.Bardziej elastyczny w użyciu niż kodowanie Huffmana, nie wymaga wiedzy o maksymalnych wartościach całkowitych z wyprzedzeniem.Jednak kodowanie Huffmana i kodowanie arytmetyczne wytwarzają lepsze prędkości kompresji danych.Trwają również wysiłki w celu tworzenia uniwersalnych metod kompresji danych, które stworzyłyby algorytmy, które dobrze działają dla różnych źródeł.