การเข้ารหัสอักขระคืออะไร

การเข้ารหัสอักขระในการเขียนโปรแกรมคอมพิวเตอร์เป็นวิธีการหรืออัลกอริทึมที่ใช้ในการค้นหาการแสดงตัวเลขปกติของอักขระสัญลักษณ์หรือสัญลักษณ์ การใช้การเข้ารหัสอักขระในคอมพิวเตอร์เป็นสิ่งจำเป็นเนื่องจากข้อมูลภายในหน่วยความจำคอมพิวเตอร์และในสื่อบันทึกข้อมูลที่คอมพิวเตอร์สามารถอ่านได้จะถูกจัดเก็บเป็นลำดับของบิตหรือตัวเลข สิ่งนี้ต้องการการเข้ารหัสเพื่อแปลอักขระที่ไม่ใช่ตัวเลขที่ใช้สำหรับการแสดงผลหรือเอาต์พุตที่มนุษย์สามารถอ่านได้ในรูปแบบที่คอมพิวเตอร์สามารถจัดการได้ ในแอปพลิเคชันที่เฉพาะเจาะจงมากขึ้นเอกสาร HyperText Markup Language (HTML) ที่เว็บเบราว์เซอร์อ่านสามารถกำหนดประเภทของการเข้ารหัสอักขระที่ใช้เพื่อให้เบราว์เซอร์ทราบว่าอักขระเฉพาะชุดใดที่จะใช้เมื่อแสดงข้อมูลในเอกสาร มีการเข้ารหัสหลายรูปแบบที่ใช้อยู่แม้ว่าชุดกรรมสิทธิ์และชุดมรดกเหล่านี้จะถูกแทนที่อย่างช้าๆด้วยมาตรฐานการเข้ารหัสUnicode®

ในวันแรกของคอมพิวเตอร์เมื่อมีพื้นที่หน่วยความจำ จำกัด ตัวอักษรพื้นฐานของตัวอักษรภาษาอังกฤษ - รวมถึงเครื่องหมายวรรคตอนและตัวเลข - ถูกเก็บไว้ในลำดับ 7 บิตที่ช่วยให้ 128 ตัวอักษรที่แตกต่างกัน ในรูปแบบดั้งเดิมนี้ไบต์ 7 บิตแต่ละตัวแทนอักขระหนึ่งตัวของตัวอักษรภาษาอังกฤษตามลำดับหมายเลข การเข้ารหัสอักขระนี้มีประสิทธิภาพและในที่สุดก็เป็นมาตรฐานและใช้ในคอมพิวเตอร์ส่วนใหญ่ที่ผลิต แม้ว่าระบบการเข้ารหัสพัฒนาเป็นมาตรฐานการเข้ารหัส Unicode แต่แนวคิดยังคงเหมือนเดิม กล่าวคืออักขระแต่ละตัวในภาษานั้นเกี่ยวข้องโดยตรงกับตัวเลขเดียวภายในชุดอักขระมาตรฐานขนาดใหญ่และหมายเลขนั้นเป็นสิ่งที่คอมพิวเตอร์ใช้เพื่อจัดเก็บประมวลผลและจัดทำดัชนีอักขระ

การเข้ารหัสอักขระประเภทอื่น ๆ ได้รับการพัฒนาด้วยเหตุผลที่ต่าง บางตัวที่ถูกเน้นเฉพาะกับตัวอักษรภาษาอังกฤษและตั้งใจที่จะใช้สำหรับข้อความเท่านั้นที่จะทำการแมปตัวอักษรของพวกเขาลงในลำดับ 7 บิตแล้วแพร่กระจายไปทั่วไบต์ 8 บิตหรือ octets นี่คือผลของการบันทึก 1 บิตต่อ octet อย่างมีประสิทธิภาพโดยใช้การเข้ารหัสอักขระเป็นชนิดของการบีบอัด รูปแบบการเข้ารหัสอื่น ๆ พยายามที่จะให้ข้อมูลพื้นฐานเกี่ยวกับตัวละครและจากนั้นตัวละครเพิ่มเติมเพื่อเป็นตัวแทนของสำเนียงพิเศษที่สามารถนำมาใช้เมื่อเขียนในภาษาที่แตกต่างกันแม้ว่าสิ่งเหล่านี้ส่วนใหญ่จะถูกทอดทิ้งสำหรับวิธีการเข้ารหัสแบบตัวต่อตัว

ในเอกสาร HTML การเข้ารหัสตัวอักษรนั้นเหมือนกับแนวคิดที่กว้างขึ้นยกเว้นการเข้ารหัสที่กำหนดไว้นั้นครอบคลุมทั้งชุดอักขระทั้งหมด สิ่งนี้อาจมีความสำคัญไม่เฉพาะกับภาษาต่างประเทศ แต่สำหรับเอกสารที่ใช้สัญลักษณ์เฉพาะสำหรับวิทยาศาสตร์หรือคณิตศาสตร์ที่ไม่ได้มีอยู่ในชุดอักขระทั้งหมด นอกจากนี้ยังมีประโยชน์สำหรับการใช้เครื่องหมายวรรคตอนและร่ายมนตร์อื่น ๆ ที่อาจไม่มีอยู่หรือแมปแตกต่างกันไปตามแผนการเข้ารหัส เอกสารที่ไม่ได้กำหนดการเข้ารหัสอักขระที่ไม่ได้มาตรฐานอย่างถูกต้องอาจแสดงไม่ถูกต้องหรือเต็มไปด้วยอักขระที่ไม่มีความหมายและตัวยึดแทนข้อมูลที่อ่านได้