Internet

Ano ang pag -encode ng character?

Ang pag -encode ng character, sa computer programming, ay isang pamamaraan o algorithm na ginamit upang makahanap ng isang karaniwang numero ng representasyon ng isang character, glyph o simbolo.Ang paggamit ng pag-encode ng character sa mga computer ay kinakailangan dahil ang impormasyon sa loob ng memorya ng computer at sa nababasa na computer ay naka-imbak bilang mga pagkakasunud-sunod ng mga piraso o numero.Nangangailangan ito ng paggamit ng pag-encode upang isalin ang mga di-numerical character na ginagamit para sa pagpapakita o nababasa na output ng tao sa isang form na maaaring manipulahin ng isang computer.Sa isang mas tiyak na application, ang mga dokumento ng Hypertext Markup Language (HTML) na binabasa ng mga web browser ay maaaring tukuyin kung anong uri ng pag -encode ng character ang ginagamit nila upang ipaalam sa browser kung aling mga tiyak na character na itinakda kapag ipinapakita ang impormasyon sa dokumento.Mayroong maraming mga scheme ng pag -encode na ginagamit, kahit na marami sa mga proprietary at legacy set na ito ay dahan -dahang pinalitan ng Unicode Pamantayan sa pag -encode.kabilang ang bantas at numero at mdash;ay naka-imbak sa 7-bit na mga pagkakasunud-sunod na nagpapahintulot para sa 128 iba't ibang mga character.Sa orihinal na pamamaraan na ito, ang bawat 7-bit byte ay kumakatawan sa isang karakter ng alpabetong Ingles, na may bilang sa pagkakasunud-sunod.Ang pag -encode ng character na ito ay mahusay at sa huli ay na -standardize at ginamit sa karamihan ng mga computer na ginawa.Bagaman ang sistema ng pag -encode ay umusbong sa Unicode Pamantayan sa pag -encode, ang konsepto ay nanatiling pareho.Lalomga dahilan.Ang ilan na partikular na nakatuon sa alpabetong Ingles at inilaan na magamit para sa teksto lamang na naka-mapa ang kanilang mga character sa 7-bit na mga pagkakasunud-sunod at pagkatapos ay ikalat ang mga ito sa buong 8-bit byte, o mga octets.Ito ay nagkaroon ng epekto ng pag -save ng 1 bit bawat octet, na epektibong gumagamit ng character na pag -encode bilang isang uri ng compression.Ang iba pang mga scheme ng pag-encode ay nagtangkang magbigay ng impormasyon sa base tungkol sa isang character, at pagkatapos ay ang mga karagdagang character upang kumatawan sa mga espesyal na accent na maaaring magamit kapag nagsusulat sa ibang wika, bagaman ang mga ito ay higit sa lahat ay inabandona para sa mas simpleng isa-sa-isang pamamaraan ng pag-encode.Ang mga dokumento ng HTML, ang pag -encode ng character ay halos kapareho ng mas malawak na konsepto, maliban sa pag -encode na tinukoy ay sumasaklaw sa isang buong hanay ng mga character.Maaari itong maging mahalaga hindi lamang para sa mga wikang banyaga, ngunit para sa mga dokumento na gumagamit ng mga tiyak na simbolo para sa agham o matematika na hindi naroroon sa lahat ng mga set ng character.Maaari rin itong maging kapaki -pakinabang para sa paggamit ng bantas at iba pang mga glyph na maaaring hindi naroroon o naiiba ang nai -mapa sa mga scheme ng pag -encode.Ang mga dokumento na hindi maayos na tukuyin ang isang hindi pamantayang pag-encode ng character ay maaaring ipakita nang hindi tama o mapuno ng mga walang katuturang character at placeholder sa halip na mababasa na impormasyon.