Skip to main content

Hvad er tabsfri datakomprimering?

Tabløs datakomprimering er en computermetode til at gemme filer og kombinere dem i arkiver, der tager mindre fysisk plads i hukommelsen, end filerne ellers ville uden at miste nogen oplysninger, dataene indeholder i processen.Tablig komprimering reducerer derimod filstørrelse med tilnærmelser af dataene, og restaurering er af en tæt fax til det originale filindhold.Algoritmer, der bruges til tabsfri datakomprimering, er i det væsentlige et sæt strømlinede regler eller instruktioner til kodning af informationen ved hjælp af færre hukommelsesstykker, mens de stadig bevarer muligheden for at gendanne dataene til dets originale format uden ændring.

Nogle almindelige filtyper, der bruger tabsfri dataKomprimering inkluderer International Business Machines (IBM) computerbaseret lynlås og UNIX-computerbaseret GZIP-filarkiver.Brugt er også billedfilformater såsom Graphic Interchange Format (GIF), Portable Network Graphics (PNG) og Bitmap (BMP) filer.Datakomprimeringsalgoritmer varierer også baseret på den filtype, der komprimeres, med almindelige variationer til tekst-, lyd- og eksekverbare programfiler.

De to hovedkategorier af algoritmer til tabsfri datakomprimering er baseret på en statistisk model for inputdata og en kortlægningsmodel af bitstrenge i en datafil.Rutinemæssige statistiske algoritmer, der anvendes, er Burrows-Wheeler Transform (BWT), Abraham Lempel og Jacob ZIV (LZ77) -algoritmen, der blev offentliggjort i 1977, og forudsigelsen med delvis matching (PPM) -metode.Kortlægningsalgoritmer, der ofte anvendes, inkluderer Huffman -kodningsalgoritmen og aritmetisk kodning.

Nogle af de tabsløse datakomprimeringsalgoritmer er open source -værktøjer, og andre er proprietære og patenterede, skønt patenter på nogle også nu udløb.Dette kan resultere i, at komprimeringsmetoder undertiden anvendes til det forkerte filformat.På grund af det faktum, at visse datakomprimeringsmetoder er uforenelige med hinanden, kan lagring af blandede filer ofte forringe en komponent i en fil.For eksempel kan en billedfil med tekst, der er komprimeret, vise nedbrydning i læsbarheden af teksten, når den først er gendannet.Scannere og software, der anvender grammatikinduktion, kan udtrække mening fra tekst, der er gemt sammen med billedfiler ved at anvende det, der er kendt som latent semantisk analyse (LSA).

En anden form for kortlægningsalgoritme -metode til tabsfri datakomprimering er brugen af universel kode.Mere fleksibel at bruge end Huffman -kodning, det kræver ikke viden om maksimale heltalværdier forud for tiden.Huffman -kodning og aritmetisk kodning producerer dog bedre datakomprimeringshastigheder.Der er også en indsats for at producere universelle datakomprimeringsmetoder, der ville skabe algoritmer, der fungerer godt til forskellige kilder.