Skip to main content

Wat is karaktercodering?

Karaktercodering, in computerprogrammering, is een methode of algoritme die wordt gebruikt om een meestal numerieke weergave van een teken, glyph of symbool te vinden.Het gebruik van tekencodering in computers is noodzakelijk omdat informatie binnen computergeheugen en op computer-leesbare media wordt opgeslagen als sequenties van bits of cijfers.Dit vereist het gebruik van codering om niet-numerieke tekens te vertalen die worden gebruikt voor display of mens-leesbare uitvoer in een vorm die een computer kan manipuleren.In een meer specifieke toepassing kunnen documenten HyperText Markup Language (HTML) die worden gelezen door webbrowsers definiëren welk type tekencodes ze gebruiken om de browser te laten weten welk specifieke teken ingesteld is om de informatie in het document weer te geven.Er zijn verschillende coderingsschema's in gebruik, hoewel veel van deze eigen en oude sets langzaam worden vervangen door de Unicode coderingsstandaard.

In de begindagen van computers, wanneer er beperkte geheugenruimte was, de basiskarakters van het Engelse alfabet mdash;inclusief interpunctie en cijfers mdash;werden opgeslagen in 7-bit sequenties die 128 verschillende tekens mogelijk maken.In dit oorspronkelijke schema vertegenwoordigde elke 7-bit byte één karakter van het Engelse alfabet, genummerd in volgorde.Deze karaktercodering was efficiënt en werd uiteindelijk gestandaardiseerd en gebruikt in de meeste computers die werden geproduceerd.Hoewel het coderingssysteem evolueerde naar de Unicode reg;Codering Standard, het concept bleef hetzelfde.Namelijk, elk enkel teken in een taal is direct gerelateerd aan een enkel nummer binnen een grote standaard tekenset, en dat aantal is wat een computer gebruikt om het personage op te slaan, te verwerken en te indexeren.

Andere soorten tekencodering werden ontwikkeld voor verschillendeRedenen.Sommigen die specifiek op het Engelse alfabet waren gericht en bedoeld waren om te worden gebruikt voor tekst, brachten hun tekens alleen in kaart op 7-bit sequenties en verspreidden ze vervolgens over 8-bit bytes of octetten.Dit had het effect van het besparen van 1 bit per octet, effectief met behulp van karaktercodering als een type compressie.Andere coderende schema's probeerden basisinformatie over een personage te verstrekken, en vervolgens extra tekens om speciale accenten weer te geven die konden worden gebruikt bij het schrijven in een andere taal, hoewel deze grotendeels werden verlaten voor de eenvoudigere één-op-één coderingsmethoden.

inHTML -documenten, tekencodering is ongeveer hetzelfde als het bredere concept, behalve dat de codering wordt gedefinieerd een hele reeks tekens omvat.Dit kan niet alleen belangrijk zijn voor vreemde talen, maar voor documenten die specifieke symbolen gebruiken voor wetenschap of wiskunde die niet aanwezig zijn in alle tekensets.Het kan ook nuttig zijn voor het gebruik van interpunctie en andere glyphs die mogelijk niet aanwezig zijn of anders worden toegewezen in coderingsschema's.Documenten die een niet-standaard tekencodes niet goed definiëren, kunnen onjuist worden weergegeven of worden gevuld met onzinnige tekens en tijdelijke aanduidingen in plaats van leesbare informatie.