Skip to main content

Hva er en bred karakter?

En bred karakter er et datakarakter som har en størrelse som overstiger standard 8-biters måling.Tegn i et datamaskinsett som Universal Character Set (USC) illustrerer et godt eksempel på brede karakter, da USC kan kodes i 16-biters eller 32-biters formater.Dette skiller seg fra eldre, standardiserte tegnsett som den amerikanske standardkoden for informasjonsutveksling (ASCII), som bruker karakter av ikke mer enn 7-bits.Fordelen med å kode karaktersett i brede karakterer er at det gir mulighet for mer pusterom når det er på tide å legge til flere og komplekse symboler til settet, og gir karakterdesignere et bredere spekter av frihet.Ulemper kommer i form av ekstra minneforbruk, ettersom bredt karakter sett bruker mer systemminne mens de er aktive på datamaskinen.

Karaktersett må tilpasses for å fungere med spesifikke operativsystemer, og brede tegn er ikke annerledes.For Windows Operativsystemer-både 32 og 64-biters versjoner-bredt karaktersett må være skreddersydd for å passe innenfor et 16-biters rammeverk, og tilbyr dobbelt lagringskapasitet for hvert tegn sammenlignet med et standard 8-biters sett.Unix , derimot, krever brede tegn for å passe til et 32-biters rammeverk, og tilbyr fire ganger kapasiteten til et grunnleggende tegnsett.

Den største fordelen med brede karaktersett er at de tillater ikke-standardsymboler og større allsidighet i å inkludere forskjellige språk i grensesnittene.For eksempel kan brede karaktersett inkludere det engelske alfabetet, sammen med språk som kyrillisk og gresk samtidig.Dette betyr at et enkelt sett med brede karakterer kan gjelde for enkeltpersoner som spenner over flere land, i motsetning til å kreve et unikt ikke-bredt sett med karakterer for hvert enkelt språkregion.

Selv om det er nyttig for å hjelpe til med å standardisere versjoner av programvare på tvers av forskjellige språkregioner, kommer sett med brede karakterer til en pris.Den prisen er en ekstra kostnad i minnet overhead.Mens et 16-biters karaktersett gir dobbelt så mye som et standard 8-biters sett, bruker det også dobbelt så mye minne.Det samme gjelder 32-biters karaktersett, som svelger et betydelig fire ganger så mye minne som konvensjonelle karaktersett.

fra databehandling og statistiske perspektiver, dette er en betydelig kostnad for minnet.I praktisk anvendelse er imidlertid ikke kostnadene så store som det kan se ut.Moderne datamaskiner inneholder ofte fire eller flere gigabyte med systemminne, noe som gjør lagring av til og med et stort 32-biters karakter satt ganske ubetydelig i praksis.Bare de mest overarbeidede mdash;eller underkraftig mdash;Datamaskiner vil merke en betydelig ytelse fra å bruke sett med brede tegn.