Skip to main content

Τι είναι η κωδικοποίηση χαρακτήρων;

Η κωδικοποίηση χαρακτήρων, στον προγραμματισμό υπολογιστών, είναι μια μέθοδος ή ένας αλγόριθμος που χρησιμοποιείται για να βρεθεί μια συνήθως αριθμητική αναπαράσταση ενός χαρακτήρα, glyph ή σύμβολο.Η χρήση της κωδικοποίησης χαρακτήρων σε υπολογιστές είναι απαραίτητη επειδή οι πληροφορίες εντός της μνήμης του υπολογιστή και σε μέσα αναγνώσιμα από υπολογιστή αποθηκεύονται ως αλληλουχίες bits ή αριθμών.Αυτό απαιτεί τη χρήση της κωδικοποίησης για να μεταφράσουν μη αριθμητικούς χαρακτήρες που χρησιμοποιούνται για την εμφάνιση ή την αναγνώσιμη από τον άνθρωπο σε μια μορφή που μπορεί να χειριστεί ένας υπολογιστής.Σε μια πιο συγκεκριμένη εφαρμογή, τα έγγραφα HyperText Markup (HTML) που διαβάζονται από τα προγράμματα περιήγησης ιστού μπορούν να καθορίσουν τον τύπο κωδικοποίησης χαρακτήρων που χρησιμοποιούν για να αφήσουν το πρόγραμμα περιήγησης να γνωρίζει ποιο συγκεκριμένο χαρακτήρα που θα χρησιμοποιηθεί κατά την εμφάνιση των πληροφοριών στο έγγραφο.Υπάρχουν πολλά συστήματα κωδικοποίησης που χρησιμοποιούνται, αν και πολλά από αυτά τα ιδιόκτητα και κληρονομιά σύνολα αντικαθίστανται αργά από το Unicode Reg.Κωδικοποίηση του προτύπου.

Στις πρώτες ημέρες των υπολογιστών, όταν υπήρχε περιορισμένος χώρος μνήμης, οι βασικοί χαρακτήρες του αγγλικού αλφαβήτου mdash;συμπεριλαμβανομένης της στίξης και των αριθμών mdash;αποθηκεύτηκαν σε αλληλουχίες 7-bit που επιτρέπουν 128 διαφορετικούς χαρακτήρες.Σε αυτό το αρχικό σχήμα, κάθε byte 7-bit αντιπροσώπευε έναν χαρακτήρα του αγγλικού αλφαβήτου, αριθμημένο σε ακολουθία.Αυτή η κωδικοποίηση χαρακτήρων ήταν αποτελεσματική και τελικά τυποποιήθηκε και χρησιμοποιήθηκε στους περισσότερους υπολογιστές που παρήχθησαν.Αν και το σύστημα κωδικοποίησης εξελίχθηκε στο Unicode Reg.Κωδικοποίηση του προτύπου, η έννοια παρέμεινε η ίδια.Δηλαδή, κάθε μόνο χαρακτήρας σε μια γλώσσα σχετίζεται άμεσα με έναν μόνο αριθμό μέσα σε ένα μεγάλο πρότυπο σύνολο χαρακτήρων και ο αριθμός αυτός είναι αυτό που χρησιμοποιεί ένας υπολογιστής για την αποθήκευση, τη διαδικασία και την ευρετηρίαση του χαρακτήρα.

Άλλοι τύποι κωδικοποίησης χαρακτήρων αναπτύχθηκαν για διαφορετικάαιτιολογικό.Μερικοί που είχαν προσανατολιστεί ειδικά στο αγγλικό αλφάβητο και προορίζονταν να χρησιμοποιηθούν για κείμενο μόνο χαρτογράφησαν τους χαρακτήρες τους σε αλληλουχίες 7-bit και στη συνέχεια τους απλώνουν σε bytes 8-bit ή οκτάδες.Αυτό είχε ως αποτέλεσμα την εξοικονόμηση 1 bit ανά οκτάδα, χρησιμοποιώντας αποτελεσματικά την κωδικοποίηση χαρακτήρων ως τύπο συμπίεσης.Άλλα συστήματα κωδικοποίησης προσπάθησαν να παρέχουν πληροφορίες σχετικά με έναν χαρακτήρα και στη συνέχεια πρόσθετους χαρακτήρες για να αντιπροσωπεύουν ειδικές προφορές που θα μπορούσαν να χρησιμοποιηθούν όταν γράφουν σε διαφορετική γλώσσα, αν και αυτά εγκαταλείφθηκαν σε μεγάλο βαθμό για τις απλούστερες μεθόδους κωδικοποίησης.Τα έγγραφα HTML, η κωδικοποίηση χαρακτήρων είναι περίπου η ίδια με την ευρύτερη ιδέα, εκτός από την καθορισμένη κωδικοποίηση που περιλαμβάνει ένα ολόκληρο σύνολο χαρακτήρων.Αυτό μπορεί να είναι σημαντικό όχι μόνο για ξένες γλώσσες, αλλά για έγγραφα που χρησιμοποιούν συγκεκριμένα σύμβολα για την επιστήμη ή τα μαθηματικά που δεν υπάρχουν σε όλα τα σύνολα χαρακτήρων.Μπορεί επίσης να είναι χρήσιμο για τη χρήση σημείων στίξης και άλλων glyphs που μπορεί να μην υπάρχουν ή να χαρτογραφούνται διαφορετικά μεταξύ των συστημάτων κωδικοποίησης.Τα έγγραφα που δεν καθορίζουν σωστά μια μη τυποποιημένη κωδικοποίηση χαρακτήρων θα μπορούσαν να εμφανίζουν εσφαλμένα ή να γεμίζουν με ανόητους χαρακτήρες και κράτηση αντί για αναγνώσιμες πληροφορίες.