Internet

Apa itu pengkodean karakter?

Pengkodean karakter, dalam pemrograman komputer, adalah metode atau algoritma yang digunakan untuk menemukan representasi numerik dari karakter, mesin terbang atau simbol.Penggunaan pengkodean karakter di komputer diperlukan karena informasi dalam memori komputer dan pada media yang dapat dibaca komputer disimpan sebagai urutan bit atau angka.Ini membutuhkan penggunaan pengkodean untuk menerjemahkan karakter non-numerik yang digunakan untuk tampilan atau output yang dapat dibaca manusia ke dalam bentuk yang dapat dimanipulasi komputer.Dalam aplikasi yang lebih spesifik, dokumen Hypertext Markup Language (HTML) yang dibaca oleh browser web dapat menentukan jenis pengkodean karakter apa yang mereka gunakan untuk memberi tahu browser yang diketahui karakter spesifik mana yang akan digunakan saat menampilkan informasi dalam dokumen.Ada beberapa skema penyandian yang digunakan, meskipun banyak dari set kepemilikan dan warisan ini perlahan -lahan digantikan oleh Unicode Standar pengkodean.

Pada hari -hari awal komputer, ketika ada ruang memori yang terbatas, karakter dasar dari alfabet mdash bahasa Inggris;termasuk tanda baca dan angka mdash;disimpan dalam urutan 7-bit yang memungkinkan untuk 128 karakter yang berbeda.Dalam skema asli ini, masing-masing byte 7-bit mewakili satu karakter dari alfabet Inggris, bernomor secara berurutan.Pengkodean karakter ini efisien dan akhirnya distandarisasi dan digunakan di sebagian besar komputer yang diproduksi.Meskipun sistem pengkodean berevolusi menjadi Unicode Standar pengkodean, konsepnya tetap sama.Yaitu, setiap karakter tunggal dalam suatu bahasa secara langsung terkait dengan nomor tunggal dalam set karakter standar yang besar, dan angka itu adalah apa yang digunakan komputer untuk menyimpan, memproses, dan mengindeks karakter.

Jenis pengkodean karakter lainnya dikembangkan untuk berbedaalasan.Beberapa yang diarahkan khusus untuk alfabet Inggris dan dimaksudkan untuk digunakan untuk teks hanya memetakan karakter mereka ke urutan 7-bit dan kemudian menyebarkannya di seluruh byte 8-bit, atau oktet.Ini memiliki efek menghemat 1 bit per oktet, secara efektif menggunakan pengkodean karakter sebagai jenis kompresi.Skema pengkodean lain berusaha memberikan informasi dasar tentang karakter, dan kemudian karakter tambahan untuk mewakili aksen khusus yang dapat digunakan saat menulis dalam bahasa yang berbeda, meskipun ini sebagian besar ditinggalkan untuk metode pengkodean satu-ke-satu yang lebih sederhana.Dokumen HTML, pengkodean karakter kira -kira sama dengan konsep yang lebih luas, kecuali pengkodean yang didefinisikan mencakup seluruh set karakter.Ini bisa menjadi penting tidak hanya untuk bahasa asing, tetapi untuk dokumen yang menggunakan simbol spesifik untuk sains atau matematika yang tidak ada dalam semua set karakter.Ini juga dapat berguna untuk menggunakan tanda baca dan mesin terbang lain yang mungkin tidak ada atau dipetakan secara berbeda di seluruh skema pengkodean.Dokumen yang tidak mendefinisikan pengkodean karakter non-standar dapat ditampilkan secara tidak benar atau diisi dengan karakter dan placeholder yang tidak masuk akal alih-alih informasi yang dapat dibaca.