Skip to main content

Τι είναι ένας ευρύς χαρακτήρας;

Ένας ευρύς χαρακτήρας είναι ένας χαρακτήρας του υπολογιστή που έχει μέγεθος που υπερβαίνει την τυπική μέτρηση 8-bit.Οι χαρακτήρες σε ένα σετ υπολογιστών όπως το σύνολο Universal Character (USC) απεικονίζουν ένα πρωταρχικό παράδειγμα ευρείων χαρακτήρων, καθώς το USC μπορεί να κωδικοποιηθεί σε μορφές 16-bit ή 32 bit.Αυτό διαφέρει από τα παλαιότερα, τυποποιημένα σύνολα χαρακτήρων, όπως ο αμερικανικός τυποποιημένος κώδικας για την ανταλλαγή πληροφοριών (ASCII), το οποίο χρησιμοποιεί χαρακτήρα όχι περισσότερο από 7-bits.Το πλεονέκτημα για την κωδικοποίηση των συνόλων χαρακτήρων σε ευρείς χαρακτήρες είναι ότι επιτρέπει περισσότερη αίθουσα αναπνοής όταν έρχεται χρόνος για να προσθέσετε επιπλέον και σύνθετα σύμβολα στο σετ, δίνοντας στους σχεδιαστές χαρακτήρων ένα ευρύτερο φάσμα ελευθερίας.Τα μειονεκτήματα έρχονται με τη μορφή πρόσθετης κατανάλωσης μνήμης, καθώς τα ευρύτατα σύνολα χαρακτήρων χρησιμοποιούν περισσότερη μνήμη συστήματος ενώ είναι ενεργά στον υπολογιστή.

Τα σύνολα χαρακτήρων πρέπει να προσαρμοστούν για να λειτουργούν με συγκεκριμένα λειτουργικά συστήματα και οι ευρείς χαρακτήρες δεν διαφέρουν.Για Windows Τα λειτουργικά συστήματα-και οι δύο εκδόσεις 32 και 64-bit-τα σύνολα χαρακτήρων πρέπει να είναι προσαρμοσμένα ώστε να ταιριάζουν μέσα σε ένα πλαίσιο 16-bit, προσφέροντας διπλάσια χωρητικότητα αποθήκευσης για κάθε χαρακτήρα σε σύγκριση με ένα τυπικό σύνολο 8 bit.Το Unix reg, από την άλλη πλευρά, απαιτεί ευρείς χαρακτήρες για να ταιριάζει σε ένα πλαίσιο 32-bit, προσφέροντας τέσσερις φορές την χωρητικότητα ενός βασικού συνόλου χαρακτήρων.

Το μεγαλύτερο πλεονέκτημα των μεγάλων συνόλων χαρακτήρων είναι ότι επιτρέπουν τα μη τυποποιημένα σύμβολα και την μεγαλύτερη ευελιξία στην συμπερίληψη διαφορετικών γλωσσών στις διεπαφές τους.Για παράδειγμα, τα ευρύτατα σύνολα χαρακτήρων μπορούν να περιλαμβάνουν το πρότυπο αγγλικό αλφάβητο, μαζί με γλώσσες όπως τα κυριλλικά και τα ελληνικά ταυτόχρονα.Αυτό σημαίνει ότι ένα ενιαίο σύνολο μεγάλων χαρακτήρων μπορεί να εφαρμοστεί σε άτομα που καλύπτουν πολλές χώρες, σε αντίθεση με την απαίτηση ενός μοναδικού μη ευρείας σειράς χαρακτήρων για κάθε μεμονωμένη γλωσσική περιοχή.

Αν και χρήσιμο για την τυποποίηση των εκδόσεων του λογισμικού σε διαφορετικές γλωσσικές περιοχές, τα σύνολα μεγάλων χαρακτήρων έρχονται σε τιμή.Αυτή η τιμή είναι ένα πρόσθετο κόστος στη μνήμη.Ενώ ένα σύνολο χαρακτήρων 16-bit προσφέρει διπλάσια χωρητικότητα ενός τυπικού συνόλου 8-bit, καταναλώνει επίσης διπλάσια μνήμη.Το ίδιο ισχύει και για τα σύνολα χαρακτήρων 32-bit, τα οποία καταπιούν σημαντική τέσσερις φορές μεγαλύτερη μνήμη από τα συμβατικά σύνολα χαρακτήρων.Στην πρακτική εφαρμογή, ωστόσο, το κόστος δεν είναι τόσο μεγάλο όσο φαίνεται.Οι σύγχρονοι υπολογιστές περιέχουν συχνά τέσσερα ή περισσότερα gigabytes της μνήμης του συστήματος, καθιστώντας την αποθήκευση ακόμη και ενός μεγάλου χαρακτήρα 32-bit που σετ αρκετά αμελητέα στην πράξη.Μόνο το πιο υπερβολικό mdash;ή υποτιμημένο mdash;Οι υπολογιστές θα παρατηρήσουν ένα σημαντικό χτύπημα απόδοσης από τη χρήση σετ ευρέων χαρακτήρων.