Skip to main content

การบีบอัดข้อมูลแบบไม่สูญเสียคืออะไร?

การบีบอัดข้อมูลแบบไม่สูญเสียเป็นวิธีคอมพิวเตอร์ในการจัดเก็บไฟล์และรวมเข้ากับคลังเก็บที่ใช้พื้นที่ทางกายภาพน้อยกว่าในหน่วยความจำมากกว่าไฟล์ที่จะสูญเสียข้อมูลใด ๆ ที่ข้อมูลมีอยู่ในกระบวนการการบีบอัดที่สูญเสียไปในทางตรงกันข้ามลดขนาดไฟล์ด้วยการประมาณของข้อมูลและการฟื้นฟูนั้นเป็นโทรสารที่ใกล้ชิดกับเนื้อหาไฟล์ต้นฉบับอัลกอริทึมที่ใช้สำหรับการบีบอัดข้อมูลแบบไม่สูญเสียนั้นเป็นชุดของกฎหรือคำแนะนำที่คล่องตัวสำหรับการเข้ารหัสข้อมูลโดยใช้หน่วยความจำน้อยลงในขณะที่ยังคงรักษาความสามารถในการกู้คืนข้อมูลไปยังรูปแบบดั้งเดิมโดยไม่มีการเปลี่ยนแปลง

ประเภทไฟล์ทั่วไปบางประเภทที่ใช้ข้อมูลที่ไม่สูญเสียการบีบอัดรวมถึงเครื่อง Zip ที่ใช้คอมพิวเตอร์และคอมพิวเตอร์ GZIP ที่ใช้คอมพิวเตอร์ GZIP บนคอมพิวเตอร์และ UNIXนอกจากนี้ยังใช้เป็นรูปแบบไฟล์รูปภาพเช่นรูปแบบการแลกเปลี่ยนกราฟิก (GIF), กราฟิกเครือข่ายแบบพกพา (PNG) และไฟล์บิตแมป (BMP)อัลกอริทึมการบีบอัดข้อมูลยังแตกต่างกันไปตามประเภทไฟล์ที่ถูกบีบอัดพร้อมกับรูปแบบทั่วไปสำหรับข้อความเสียงและไฟล์โปรแกรมที่เรียกใช้งานได้

อัลกอริทึมหลักสองประเภทหลักสำหรับการบีบอัดข้อมูลแบบไม่สูญเสียจะขึ้นอยู่กับแบบจำลองทางสถิติของข้อมูลอินพุตและรูปแบบการแมปของสตริงบิตในไฟล์ข้อมูลอัลกอริทึมทางสถิติประจำที่ใช้คือการแปลง Burrows-Wheeler (BWT), Abraham Lempel และ Jacob Ziv (LZ77) อัลกอริทึมที่ตีพิมพ์ในปี 1977 และการทำนายโดยวิธีการจับคู่บางส่วน (PPM)อัลกอริทึมการทำแผนที่ที่ใช้บ่อย ได้แก่ อัลกอริทึมการเข้ารหัส Huffman และการเข้ารหัสเลขคณิต

อัลกอริทึมการบีบอัดข้อมูลที่ไม่สูญเสียบางส่วนเป็นเครื่องมือโอเพ่นซอร์สและอื่น ๆ เป็นกรรมสิทธิ์และสิทธิบัตรซึ่งอาจส่งผลให้เกิดวิธีการบีบอัดบางครั้งถูกนำไปใช้กับรูปแบบไฟล์ที่ไม่ถูกต้องเนื่องจากความจริงที่ว่าวิธีการบีบอัดข้อมูลบางอย่างไม่เข้ากันซึ่งกันและกันการจัดเก็บไฟล์ผสมมักจะทำให้ส่วนประกอบของไฟล์ลดลงตัวอย่างเช่นไฟล์รูปภาพที่มีข้อความที่ถูกบีบอัดสามารถแสดงการเสื่อมสภาพในความสามารถในการอ่านข้อความเมื่อกู้คืนได้สแกนเนอร์และซอฟต์แวร์ที่ใช้การเหนี่ยวนำไวยากรณ์สามารถแยกความหมายจากข้อความที่เก็บไว้พร้อมกับไฟล์รูปภาพโดยใช้สิ่งที่เรียกว่าการวิเคราะห์ความหมายแฝง (LSA)

รูปแบบอื่นของวิธีการทำแผนที่อัลกอริทึมสำหรับการบีบอัดข้อมูลที่ไม่สูญเสียคือการใช้รหัสสากลมีความยืดหยุ่นในการใช้มากกว่าการเข้ารหัส Huffman มันไม่จำเป็นต้องมีความรู้เกี่ยวกับค่าจำนวนเต็มสูงสุดก่อนเวลาอย่างไรก็ตามการเข้ารหัสการเข้ารหัสและเลขคณิตจะสร้างอัตราการบีบอัดข้อมูลที่ดีขึ้นอย่างไรก็ตามความพยายามยังดำเนินการเพื่อผลิตวิธีการบีบอัดข้อมูลสากลที่จะสร้างอัลกอริทึมที่ทำงานได้ดีสำหรับแหล่งข้อมูลที่หลากหลาย