Skip to main content

Qu'est-ce que la compression de données sans perte?

La compression de données sans perte est une méthode informatique de stockage de fichiers et de les combiner en archives qui occupent moins d'espace physique en mémoire que les fichiers autrement sans perdre les informations que les données contient dans le processus.La compression avec perte, en revanche, réduit la taille du fichier avec les approximations des données, et la restauration est d'un fac-similé proche du contenu du fichier d'origine.Les algorithmes utilisés pour la compression de données sans perte sont essentiellement un ensemble de règles ou d'instructions rationalisées pour coder les informations en utilisant moins de bits de mémoire tout en conservant la possibilité de restaurer les données à son format d'origine sans altération.

Certains types de fichiers courants qui utilisent des données sans perteLa compression inclut les archives de fichiers GZIP International Machines Machines (IBM) et GZIP.Les formats de fichiers d'image sont également utilisés tels que le format d'interchange graphique (GIF), les fichiers de graphiques réseau portables (PNG) et Bitmap (BMP).Les algorithmes de compression de données varient également en fonction du type de fichier compressé, avec des variations communes pour les fichiers de texte, audio et exécutable.

Les deux principales catégories d'algorithmes pour la compression de données sans perte sont basées sur un modèle statistique de données d'entrée et un modèle de cartographie des chaînes de bits dans un fichier de données.Les algorithmes statistiques de routine utilisés sont le Burrows-Wheeler Transform (BWT), l'algorithme Abraham Lempel et Jacob Ziv (LZ77) publié en 1977 et la méthode de prédiction par correspondance partielle (PPM).Les algorithmes de cartographie fréquemment utilisés comprennent l'algorithme de codage Huffman et le codage arithmétique.

Certains des algorithmes de compression de données sans perte sont des outils open source et d'autres sont propriétaires et brevetés, bien que les brevets sur certains aient également expiré.Cela peut entraîner des méthodes de compression qui sont parfois appliquées au mauvais format de fichier.En raison du fait que certaines méthodes de compression de données sont incompatibles les unes avec les autres, le stockage de fichiers mixtes peut souvent dégrader un composant d'un fichier.Par exemple, un fichier image avec du texte compressé peut afficher une dégradation dans la lisibilité du texte une fois restauré.Les scanners et les logiciels qui utilisent l'induction de grammaire peuvent extraire le sens du texte stocké avec les fichiers image en appliquant ce que l'on appelle l'analyse sémantique latente (LSA).

Une autre forme de méthode d'algorithme de cartographie pour la compression de données sans perte est l'utilisation du code universel.Plus flexible à utiliser que le codage de Huffman, il ne nécessite pas de connaissance des valeurs entières maximales à l'avance.Le codage de Huffman et le codage arithmétique produisent cependant de meilleurs taux de compression de données.Des efforts sont également en cours pour produire des méthodes de compression de données universelles qui créeraient des algorithmes qui fonctionnent bien pour une variété de sources.