来自维基百科,自由的百科全书
ISO-IR-165《通訊用中文多位元組字符集》(Codes of the Chinese graphic character set for communication)是中國大陸於1992年為國際電信聯盟電信標準化部門(CCITT)[1] 創製之中文多位元組通訊字符集。該編碼在ISO 2022下註冊的名稱為 ISO-IR-165,可以使用 ISO-2022-CN-EXT 進行編碼。
ISO-IR-165 整合 GB 2312(包括 GB/T 6345.1-86《信息交換用漢字 32x32 點陣字模集》新增之字符及調整[2])以及 GB/T 8565.2-88《信息處理文本通信用編碼字符集 第二部分:圖形字符集》。該標準合共 8446 個字符。
GB/T 6345.1-1986《信息交換用漢字 32x32 點陣字模集》(後續改成GB/T 6345.1-2010)包括了對 GB/T 2312 的修正和補充。[2]相關的修訂最早是由GB 5007.1–85《信息交換用漢字 24x24 點陣字模集》所加入。
區位碼 | EUC碼 | GB/T 2312(未修訂) | GB/T 6341.1 | 備註 |
---|---|---|---|---|
03-71 | 0xA3E7 | ![]() |
ɡ | [a] |
79-81 | 0xEFF1 | 鍾 | 鍾 | [b] |
後續實踐 GB/T 2312 的編碼(如Windows 的代碼頁936)將 79-81 對應的漢字 Unicode 碼從「鍾」改為「锺」。[3]
GB/T 6345.1-86 也在 GB/T 2312 的基礎上在第 10 區補充了ISO 646-CN 的半寬字符(3 區的字符為全寬字符)和第 8 區補充了 6 個漢語拼音字符。[2]這些補充也在 GB/T 12345 內出現,而 GB/T 12345 也額外在第 6 區加上了 29 個豎排標點符號。[2][4]
2011年發佈的 GB/T 6345.1-2010 正式在第 11 區增加了對應 8 區 32 個漢語拼音字符(包括新補充的6個字符)的半寬版本。[5]這個補充並未在 GB 18030 內實行。[6]
Classic Mac OS 內的簡體中文編碼(基於EUC-CN修改)[7] 和 GB 18030 包含了 GB/T 6345.1 補充的 6 個漢語拼音字符(但是不包括半寬版本)和 GB/T 12345 補充的豎排標點符號。[6] 新增的 6 個漢語拼音字符如下:[7]
區位碼 | EUC碼 | 字符[7][6] | 備註 |
---|---|---|---|
08-27 | 0xA8BB | U+0251 ɑ | |
08-28 | 0xA8BC | U+1E3F ḿ | [a] |
08-29 | 0xA8BD | U+0144 ń | |
08-30 | 0xA8BE | U+0148 ň | |
08-31 | 0xA8BF | U+01F9 ǹ | [b] |
08-32 | 0xA8C0 | U+0261 ![]() |
[c] |
U+1E3F
。[6]U+006E, U+0300
。[7] Windows CP936 映射至私用區 U+E7C8
。[8]ISO-IR-165 包括了 GB/T 6345.1 和 GB/T 8565.2 在 GB/T 2312 的新增補充字符。另外,ISO-IR-165 也新增了 161 個字符,其中 139 個漢字是「普通漢字和異體」。[2][9]有時這些 CCITT 的新增字會和 GB/T 8565.2 混淆,包括以前的 Unihan 資料庫。[1]
CCITT 在第 6 區新增了對應第 3 區的像字符[9],這些字符和 Mac OS 簡體中文[7] 和 GB 18030[6] 的新增字符相撞。
ISO-IR-165 包含了 GB/T 6345.1 的訂正,但是其中有兩個字符的 Unicode 映射與 GB/T 2312 和 GB/T 6345.1 擴展的映射不同。下表顯示各標準的映射和對應字形,也另附 GB 18030 的對應編碼:
Seamless Wikipedia browsing. On steroids.