字符編碼
維基百科,自由的 encyclopedia
字符編碼(英語:Character encoding)、字碼、字集碼是把字符集中的字符為指定集合中某一對象(例如:位元模式、自然數序列、八位元或者電脈衝),以便文本在計算機中存儲和通過通信網絡的傳遞。有時,為強調其所使用的方式而使用其他術語,譬如:為說明「電腦系統『內部』 處理文字資料所使用的字符編碼」時,會使用內碼。為「不同電腦系統之間,為了『交換』資料所採用的字符編碼」時,會使用交換碼。
此條目需要補充更多來源。 (2014年2月6日) |
常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII。其中,ASCII將字母、數字和其它符號編號,並用7位元的二進制來表示這個整數。通常會額外使用一個擴充的位元,以便於以1個字節的方式存儲。
在計算機技術發展的早期,如ASCII(1963年)和EBCDIC(1964年)這樣的字符集逐漸成為標準。但這些字符集的局限很快就變得明顯,於是人們開發了許多方法來擴展它們。對於支持包括東亞CJK字符家族在內的寫作系統的要求能支持更大量的字符,並且需要一種系統而不是臨時的方法實現這些字符的編碼。