Skip to main content

Hva er tapsfri datakomprimering?

Lossfri datakomprimering er en datamaskinmetode for lagring av filer og kombinere dem til arkiver som tar opp mindre fysisk rom i minnet enn filene ellers ville uten å miste informasjon dataene inneholder i prosessen.Tapende komprimering reduserer derimot filstørrelse med tilnærminger av dataene, og restaurering er av en nær faksimile til det opprinnelige filinnholdet.Algoritmer som brukes til tapsfri datakomprimering er i hovedsak et sett med strømlinjeformede regler eller instruksjoner for å kode informasjonen ved å bruke færre minnebiter, mens du fremdeles beholder muligheten til å gjenopprette dataene til det opprinnelige formatet uten endring.

Noen vanlige filtyper som bruker tapsfrie dataKomprimering inkluderer International Business Machines (IBM) Computer-Based ZIP og UNIX Computer-Based GZIP File Archives.Brukte bildefilformater som Graphic Interchange Format (GIF), Portable Network Graphics (PNG) og Bitmap (BMP) -filer.Datakomprimeringsalgoritmer varierer også basert på at filtypen blir komprimert, med vanlige variasjoner for tekst-, lyd- og kjørbare programfiler.

De to hovedkategoriene av algoritmer for tapsfri datakomprimering er basert på en statistisk modell av inngangsdata og en kartleggingsmodell av bitstrenger i en datafil.Rutinemessige statistiske algoritmer som brukes er Burrows-Wheeler Transform (BWT), Abraham Lempel og Jacob ZIV (LZ77) algoritmen publisert i 1977, og prediksjonen ved delvis matching (PPM) metode.Dette kan føre til at komprimeringsmetoder noen ganger blir brukt på feil filformat.På grunn av det faktum at visse datakomprimeringsmetoder er uforenlige med hverandre, kan lagring av blandede filer ofte nedbryte en komponent i en fil.For eksempel kan en bildefil med tekst som er komprimert vise nedbrytning i lesbarheten til teksten når den er gjenopprettet.Skannere og programvare som bruker grammatikkinduksjon kan trekke ut betydning fra tekst som er lagret sammen med bildefiler ved å bruke det som er kjent som latent semantisk analyse (LSA).

En annen form for kartleggingsalgoritmmetode for tapsfri datakomprimering er bruken av universell kode.Mer fleksibel å bruke enn Huffman -koding, det krever ikke kunnskap om maksimale heltallverdier på forhånd.Huffman -koding og aritmetisk koding gir imidlertid bedre datakomprimeringshastigheter.Det pågår også innsats for å produsere universelle datakomprimeringsmetoder som vil skape algoritmer som fungerer bra for en rekke kilder.