Skip to main content

Wat is lossless gegevenscompressie?

Verliesloze gegevenscompressie is een computermethode om bestanden op te slaan en ze te combineren in archieven die minder fysieke ruimte in het geheugen op zich nemen dan de bestanden anders zonder informatie te verliezen die de gegevens in het proces bevatten.Verliescompressie daarentegen vermindert de bestandsgrootte met benaderingen van de gegevens en herstel is van een nauwe facsimile voor de oorspronkelijke bestandsinhoud.Algoritmen die worden gebruikt voor lossless datacompressie zijn in wezen een reeks gestroomlijnde regels of instructies voor het coderen van de informatie met minder geheugen.Compressie omvat de International Business Machines (IBM) computergebaseerde ZIP- en UNIX-computergebaseerde GZIP-bestandsarchieven.Ook worden afbeeldingsbestandsformaten gebruikt, zoals het grafische uitwisselingsformaat (GIF), Portable Network Graphics (PNG) en bitmap (BMP) -bestanden.Gegevenscompressie -algoritmen variëren ook op basis van het bestandstype dat wordt gecomprimeerd, met gemeenschappelijke variaties voor tekst-, audio- en uitvoerbare programmabestanden.

De twee hoofdcategorieën van algoritmen voor lossless datacompressie zijn gebaseerd op een statistisch model van invoergegevens en een kaartmodel van bitreeksen in een gegevensbestand.De gebruikte routine statistische algoritmen zijn de Burrows-Wheeler Transform (BWT), de Abraham Lempel en Jacob Ziv (LZ77) algoritme gepubliceerd in 1977, en de voorspelling door Partial Matching (PPM) -methode.In kaart brengen algoritmen die vaak worden gebruikt, omvatten het Huffman -coderingsalgoritme en rekenkundige codering.

Sommige van de verliesloze gegevenscompressie -algoritmen zijn open source tools en andere zijn gepatenteerd en gepatenteerd, hoewel patenten op sommige nu ook zijn verlopen.Dit kan ertoe leiden dat compressiemethoden soms worden toegepast op het verkeerde bestandsformaat.Vanwege het feit dat bepaalde datacompressiemethoden niet compatibel zijn met elkaar, kan het opslaan van gemengde bestanden vaak een onderdeel van een bestand afbreken.Een afbeeldingsbestand met tekst dat wordt gecomprimeerd kan bijvoorbeeld afbraak in de leesbaarheid van de tekst weergeven zodra ze eenmaal zijn hersteld.Scanners en software die gebruik maken van grammatica -inductie kan betekenis extraheren uit tekst die is opgeslagen samen met beeldbestanden door toe te passen wat bekend staat als latente semantische analyse (LSA).

Een andere vorm van mapping -algoritmemethode voor verliesloze gegevenscompressie is het gebruik van universele code.Flexibeler om te gebruiken dan Huffman -codering, het vereist geen kennis van maximale gehele waarden van tevoren.Huffman -codering en rekenkundige codering produceren echter betere gegevenscompressiesnelheden.Er zijn ook inspanningen om universele datacompressiemethoden te produceren die algoritmen zouden creëren die goed werken voor verschillende bronnen.