Skip to main content

Hva er karakterkoding?

Tegnkoding, i dataprogrammering, er en metode eller algoritme som brukes til å finne en vanligvis numerisk representasjon av et tegn, glyf eller symbol.Bruken av karakterkoding i datamaskiner er nødvendig fordi informasjon innen dataminne og på datamaskinlesbare medier lagres som sekvenser av biter eller tall.Dette krever bruk av koding for å oversette ikke-numeriske tegn som brukes til skjerm eller menneskelig lesbar output til en form som en datamaskin kan manipulere.I en mer spesifikk applikasjon kan Hypertext Markup Language (HTML) dokumenter som leses av nettlesere definere hvilken type tegnkoding de bruker for å la nettleseren få vite hvilket spesifikt tegn som skal brukes når du viser informasjonen i dokumentet.Det er flere kodingsordninger som er i bruk, selv om mange av disse proprietære og arvesettene sakte erstattes av Unicode kodingsstandard.

.inkludert tegnsetting og tall og mdash;ble lagret i 7-bits sekvenser som muliggjorde 128 forskjellige tegn.I dette originale skjemaet representerte hver 7-biters byte ett tegn i det engelske alfabetet, nummerert i rekkefølge.Denne karakterkodingen var effektiv og ble til slutt standardisert og brukt i de fleste datamaskiner som ble produsert.Selv om kodingssystemet utviklet seg til Unicode Kodingsstandarden, konseptet forble det samme.Nemlig at hvert enkelt tegn på et språk er direkte relatert til et enkelt tall innenfor et stort standardkaraktersett, og det tallet er det en datamaskin bruker for å lagre, behandle og indeksere tegnet. Andre typer karakterkoding ble utviklet for forskjelligegrunner.Noen som var spesifikt rettet mot det engelske alfabetet og hadde til hensikt å brukes til tekst bare kartla karakterene sine på 7-bits sekvenser og deretter spre dem over 8-biters byte, eller oktetter.Dette hadde effekten av å spare 1 bit per oktett, effektivt ved bruk av karakterkoding som en type komprimering.Andre kodingsordninger forsøkte å gi baseinformasjon om et tegn, og deretter flere tegn for å representere spesielle aksenter som kunne brukes når du skriver på et annet språk, selv om disse i stor grad ble forlatt for de enklere en-til-en-kodingsmetodene. iHTML -dokumenter, karakterkoding er omtrent det samme som det bredere konseptet, bortsett fra at kodingen som er definert, omfatter et helt sett med tegn.Dette kan være viktig ikke bare for fremmedspråk, men for dokumenter som bruker spesifikke symboler for vitenskap eller matematikk som ikke er til stede i alle karaktersett.Det kan også være nyttig for bruk av tegnsetting og andre glyfer som ikke kan være til stede eller er kartlagt annerledes på tvers av kodingsordninger.Dokumenter som ikke definerer en ikke-standardkoding som ikke er standard, kan vise feil eller fylles med nonsensiske karakterer og plassholdere i stedet for lesbar informasjon.