Skip to main content

Mi a karakterkódolás?

A karakterkódolás a számítógépes programozásban egy olyan módszer vagy algoritmus, amelyet egy karakter, karakterjel vagy szimbólum általában numerikus ábrázolására használnak.A karakterkódolás használata a számítógépekben, mivel a számítógépes memóriában és a számítógépes olvasható közegekben található információk bit vagy szám szekvenciájaként tárolódnak.Ehhez a kódolás használatához szükséges a kijelző vagy az emberi olvasható kimenethez használt nem numerikus karakterek lefordítása olyan formába, amelyet egy számítógép képes manipulálni.Egy konkrétabb alkalmazásban a hypertext markup nyelv (HTML) dokumentumok, amelyeket a böngészők olvasnak, meghatározhatják, hogy milyen típusú karakterkódolást használnak, hogy a böngésző megtudja, melyik konkrét karaktert kell használni a dokumentumban szereplő információk megjelenítésekor.Számos kódolási rendszer használható, bár ezeknek a védett és örökölt készleteknek sokan lassan helyettesítik az Unicode Kódoló szabvány.beleértve az írásjeleket és a számokat mdash;7 bites szekvenciákban tárolták, amelyek 128 különböző karaktert tartalmaznak.Ebben az eredeti sémában minden 7 bites byte az angol ábécé egyik karakterét képviselte, sorrendben.Ez a karakterkódolás hatékony volt, végül szabványosított és a gyártott számítógépek többségében használták.Bár a kódoló rendszer az Unicode Kódoló szabvány szerint a koncepció változatlan maradt.Nevezetesen, a nyelv minden egyes karakterének közvetlenül kapcsolódik egy nagy szabványos karakterkészletben egyetlen számhoz, és ezt a számot egy számítógép használja a karakter tárolására, feldolgozására és indexelésére.okok.Néhányan, amelyek kifejezetten az angol ábécére kerültek, és a szöveghez szánták, csak a karakterüket 7 bites szekvenciákra térképezték fel, majd 8 bites bájtra vagy oktettekre osztották.Ennek oka az volt, hogy 1 bitet takarítson meg oktettenként, és hatékonyan használja a karakterkódolást a tömörítés típusaként.Más kódolási rendszerek megpróbálták alapinformációkat szolgáltatni egy karakterről, majd további karakterek, amelyek olyan speciális akcentusokat ábrázolnak, amelyek más nyelven történő íráskor használhatók, bár ezeket nagymértékben elhagyták az egyszerűbb egy-egy kódolási módszerekhez.HTML dokumentumok, a karakterkódolás nagyjából megegyezik a tágabb koncepcióval, kivéve a meghatározott kódolást, amely egy teljes karakterkészletet foglal magában.Ez nem csak az idegen nyelvek esetében fontos lehet, hanem azoknak a dokumentumoknak is, amelyek konkrét szimbólumokat használnak a tudományhoz vagy a matematikához, amelyek nem minden karakterkészletben vannak jelen.Hasznos lehet az írásjelek és más karakterjelek használatához is, amelyek esetleg nem jelennek meg, vagy a kódolási sémák között eltérően vannak feltérképezve.Azok a dokumentumok, amelyek nem megfelelően meghatározzák a nem szabványos karakterkódolást, helytelenül jelenhetnek meg, vagy értelmetlen karakterekkel és helyőrzőkkel tölthetők be az olvasható információk helyett.