中日韓統一表意文字擴充區B(英語:CJK Unified Ideographs Extension B)是一個Unicode區段,在Unicode版本3.1被引入。
擴充B區包含有42,711個新的漢字,位置在 U+20000–U+2A6DD。根據IRG N777號檔案(頁面存檔備份,存於互聯網檔案館),這四萬多個漢字分別從以下字典或字集中取得:
- 《康熙字典》中出現的18,486個未收錄漢字(包括一個在補遺篇出現的漢字);
- 《漢語大字典》中出現的28,914個未收錄漢字;
- 《辭源》中出現的66個未收錄漢字;
- 《辭海》中出現的247個未收錄漢字;
- 《漢語大詞典》中出現的553個未收錄漢字;
- 《中國大百科全書》中出現的86個未收錄漢字;
- 北大方正排版系統中出現的65個未收錄漢字;
- 《四庫全書》中出現的522個未收錄漢字;
- 香港增補字符集中出現的1,081個未收錄漢字;
- 日本工業標準的JIS X 0213第3水準及第4水準的302個未收錄漢字;
- 南韓 PKS 5700-3:1998 中出現的166個未收錄漢字;
- 北韓 KPS 9566-97 和 KPS 10721-2000 國家標準所收錄的5,642個漢字;
- 台灣 CNS 11643 的第4至7和15平面所收錄的30,177個漢字;
- 越南 TCVN、VHN 01:1998 和 VHN 02:1998 所收錄的4,232個喃字;
這些漢字中重複的漢字有不少,所以經過整理之後,實際總數只有42,711個漢字。
另外,在 U+2F800–U+2FA1D 的位置,放了542個來自台灣的相容漢字。
因擴充B區在整理上有缺陷,收錄了以下8個本來應該與其他漢字統一的字:[3][4]
- U+20457 𠑗 = U+34A8 㒨
- U+2420E 𤈎 = U+3DB7 㶷
- U+27144 𧅄 = U+8641 虁
- U+27EAF 𧺯 = U+FA23 﨣
- U+23515 𣔕 = U+204F2 𠓲
- U+249E9 𤧩 = U+249BC 𤦼
- U+2A415 𪐕 = U+24BD2 𤯒
- U+26866 𦡦 = U+26842 𦡂
而在 WG2 N1155檔案中,亦列出了152對可考慮統一的漢字。
Remove ads
字元列表
以下列表列出了在中日韓統一表意文字擴充區B中的所有文字:
為避免頁面過大,下列提供分段的中日韓統一表意文字擴充區B列表:
參見
參考資料
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.
Remove ads