Skip to main content

Co je kódování postav?

kódování znaků, v počítačovém programování, je metoda nebo algoritmus používaný k nalezení obvykle numerické reprezentace znaku, glyf nebo symbolu.Použití kódování znaků v počítačích je nezbytné, protože informace v paměti počítače a na počítačově čitelném médiu jsou uloženy jako sekvence bitů nebo čísel.To vyžaduje použití kódování k překladu nenumerických znaků, které se používají pro zobrazení nebo člověka čitelný výstup do formy, který může počítač manipulovat.V konkrétnější aplikaci mohou dokumenty Hypertext Markup Language (HTML), které jsou čteny webovými prohlížeči, definovat, jaký typ kódování znaků používají, aby mohli prohlížeč vědět, který konkrétní znak je při zobrazování informací v dokumentu.Používá se několik schémat kódování, i když mnoho z těchto proprietárních a dědických sad je pomalu nahrazeno Unicode Standard kódování.včetně interpunkce a čísel a mdash;byly uloženy v 7bitových sekvencích umožňujících 128 různých znaků.V tomto původním schématu představoval každý 7bitový bajt jeden znak anglické abecedy, očíslovaný v sekvenci.Toto kódování znaků bylo efektivní a bylo nakonec standardizováno a použity ve většině vyrobených počítačů.Ačkoli systém kódování se vyvinul do Unicode Standard kódování, koncept zůstal stejný.Konkrétně každý znak v jazyce přímo souvisí s jedním číslem v rámci velké standardní znakové sady a toto číslo je to, co počítač používá k ukládání, zpracování a indexování znaku.

Další typy kódování znaků byly vyvinuty pro různédůvody.Některé, které byly zaměřeny konkrétně na anglickou abecedu a měly být použity pro text, pouze mapovaly své postavy pouze na 7bitové sekvence a poté je rozšířily na 8bitové bajty nebo oktety.To mělo za následek úsporu 1 bit na oktet a efektivně používal kódování znaků jako typ komprese.Další schémata kódování se pokusila poskytnout základní informace o znaku a poté další znaky, které představují speciální akcenty, které by mohly být použity při psaní v jiném jazyce, ačkoli byly do značné míry opuštěny pro jednodušší metody kódování one-to-one.HTML dokumenty, kódování znaků je zhruba stejné jako širší koncept, s výjimkou definovaného kódování zahrnuje celou sadu znaků.To může být důležité nejen pro cizí jazyky, ale také pro dokumenty, které používají specifické symboly pro vědu nebo matematiku, které nejsou přítomny ve všech znakových sadách.Může být také užitečné pro použití interpunkční a jiných glyfů, které by nemohly být přítomny nebo jsou mapovány odlišně napříč kódovacími schématy.Dokumenty, které správně nedefinují nestandardní kódování znaků, by se mohly zobrazovat nesprávně nebo být naplněny nesmyslné znaky a zástupné symboly místo čitelných informací