中日韓統一表意文字擴充區B(英語:CJK Unified Ideographs Extension B)是一個Unicode區段,在Unicode版本3.1被引入。

Quick Facts 中日韓統一表意文字擴充區B CJK Unified Ideographs Extension B, 範圍 ...
中日韓統一表意文字擴充區B
CJK Unified Ideographs Extension B
範圍U+20000..U+2A6DF
(42,720個碼位)
平面表意文字補充平面SIP
文字漢字
已分配42,720個碼位
未分配0個保留碼位
統一碼版本歷史
3.142,711 (+42,711)
13.042,718 (+7)
14.042,720 (+2)
註釋[1][2]
Close

擴充B區包含有42,711個新的漢字,位置在 U+20000–U+2A6DD。根據IRG N777號檔案頁面存檔備份,存於互聯網檔案館),這四萬多個漢字分別從以下字典或字集中取得:

  • 康熙字典》中出現的18,486個未收錄漢字(包括一個在補遺篇出現的漢字);
  • 漢語大字典》中出現的28,914個未收錄漢字;
  • 辭源》中出現的66個未收錄漢字;
  • 辭海》中出現的247個未收錄漢字;
  • 漢語大詞典》中出現的553個未收錄漢字;
  • 中國大百科全書》中出現的86個未收錄漢字;
  • 北大方正排版系統中出現的65個未收錄漢字;
  • 四庫全書》中出現的522個未收錄漢字;
  • 香港增補字符集中出現的1,081個未收錄漢字;
  • 日本工業標準JIS X 0213第3水準及第4水準的302個未收錄漢字;
  • 南韓 PKS 5700-3:1998 中出現的166個未收錄漢字;
  • 北韓 KPS 9566-97KPS 10721-2000 國家標準所收錄的5,642個漢字;
  • 台灣 CNS 11643 的第4至7和15平面所收錄的30,177個漢字;
  • 越南 TCVNVHN 01:1998 和 VHN 02:1998 所收錄的4,232個喃字

這些漢字中重複的漢字有不少,所以經過整理之後,實際總數只有42,711個漢字。

另外,在 U+2F800–U+2FA1D 的位置,放了542個來自台灣的相容漢字

因擴充B區在整理上有缺陷,收錄了以下8個本來應該與其他漢字統一的字:[3][4]

而在 WG2 N1155檔案中,亦列出了152對可考慮統一的漢字。

字元列表

以下列表列出了在中日韓統一表意文字擴充區B中的所有文字:

為避免頁面過大,下列提供分段的中日韓統一表意文字擴充區B列表:

參見

參考資料

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.