中日韓統一表意文字

中日韓越統一表意文字
中日韓越統一表意文字
文字
上级分类	漢字字元
所属实体	通用字符集
话题方面	漢字統合
官方网站	https://unicode.org/charts/unihan.html

中日韓統一表意文字（英語：CJK Unified Ideograph），又稱統漢碼、統一漢字集（英語：Unihan），是指在ISO 10646與統一碼標準中經過「漢字等同」處理的漢字。^[2]漢字等同（英語：Han unification^[3]）是指將中文、日文、韓文、越南文、壮文、琉球文等書寫系統共通的中日韩汉字賦予相同編碼的做法；^[5]被合併編碼的漢字，往往起源相同、本義相通、形狀大同小異。^[6]整理出來的中日韓統一表意文字，由統一碼聯盟建置的Unihan資料庫維護。

事实速览 中日韓越統一表意文字, 文字 ...

本條目含有越南语的喃字，操作系统及浏览器須支持相關字符渲染才能正確显示为喃字，否则可能變成亂碼、问号、空格等其它符号。

[2]

[3]

[5]

[6]

ISO 10646版本	統一碼版本	新增	置放平面	字數	累計字數
1993	1.1	中日韓統一表意文字（U+4E00–U+9FA5）	基本多文種平面	20902	20915
		1漢字（U+3007，〇），於中日韓符號和標點區	基本多文種平面	1
		在「中日韓相容表意文字」中但實則獨一的漢字（U+FA0E﨎、U+FA0F﨏、U+FA11﨑、U+FA13﨓、U+FA14﨔、U+FA1F﨟、U+FA21﨡、U+FA23﨣、U+FA24﨤、U+FA27﨧、U+FA28﨨、U+FA29﨩）^{[註 1]}	基本多文種平面	12
1999	3.0	中日韓統一表意文字擴展區A（U+3400–U+4DB5）	基本多文種平面	6582	27497
2001	3.1	中日韓統一表意文字擴展區B（U+20000–U+2A6D6）	第二辅助平面	42711	70208
2005	4.1	HKSCS-2004未加入ISO 10646的漢字（U+9FA6–U+9FB3，龦龧龨龩龪龫龬龭龮龯龰龱龲龳）和GB 18030-2000未加入ISO 10646的印刷業常用偏旁和字形部件（U+9FB4–U+9FBB，龴龵龶龷龸龹龺龻）	基本多文種平面	22	70230
2008	5.1	7日語漢字^[13]（U+9FBC–U+9FC2，龼龽龾龿鿀鿁鿂），U+4039䀹拆分為U+4039䀹和U+9FC3鿃^[14]	基本多文種平面	8	70238
2009	5.2	中日韓統一表意文字擴展區C（U+2A700–U+2B734）	第二辅助平面	4149	74395
2009	5.2	2日語用漢字（ARIB #47、#95，U+9FC4鿄，U+9FC5鿅）、1新增漢字（ARIB #93，U+9FC6鿆）、HKSCS-2004推出後新增的5香港漢字^[15]（U+9FC7–U+9FCB，鿇鿈鿉鿊鿋）	基本多文種平面	8	74395
2010	6.0	中日韓統一表意文字擴展區D（U+2B740–U+2B81D）	第二輔助平面	222	74617
2012	6.1	1漢字（U+9FCC鿌）	基本多文種平面	1	74618
2015	8.0	中日韓統一表意文字擴展區E（U+2B820–U+2CEA1）	第二輔助平面	5762	80389
2015	8.0	「急用漢字」：《通用规范汉字表》餘下未收入的3字（U+9FCD–U+9FCF，鿍鿎鿏），1个从U+4CA4（䲤）分离出来的字U+9FD0（鿐），5个其他图书用字及化学元素用字（U+9FD1–U+9FD5，鿑鿒鿓鿔鿕）	基本多文種平面	9	80389
2017	10.0	中日韓統一表意文字擴展區F（U+2CEB0–U+2EBE0）	第二輔助平面	7473	87883
2017	10.0	21漢字（U+9FD6–U+9FEA，鿖鿗鿘鿙鿚鿛鿜鿝鿞鿟鿠鿡鿢鿣鿤鿥鿦鿧鿨鿩鿪）	基本多文種平面	21	87883
2018	11.0	5漢字（U+9FEB–U+9FEF，鿫鿬鿭鿮鿯），前三字是新命名的化學元素用字，後兩字來自日本	基本多文種平面	5	87888
2020	13.0	中日韓統一表意文字擴展區G（U+30000–U+3134A）	第三輔助平面	4939	92857
		急用科學與技術用字^[16]（U+9FF0–U+9FFC，鿰鿱鿲鿳鿴鿵鿶鿷鿸鿹鿺鿻鿼）、10個需分離的漢字^[17]^[18]^[19]（U+4DB6–U+4DBF，䶶䶷䶸䶹䶺䶻䶼䶽䶾䶿）	基本多文種平面	23
		崑曲工尺譜用字^[20]（U+2A6D7–U+2A6DD，𪛗𪛘𪛙𪛚𪛛𪛜𪛝）	第二辅助平面	7
2021	14.0	3漢字（U+9FFD–U+9FFF，鿽鿾鿿）	基本多文種平面	3	92866
		2漢字（U+2A6DE–U+2A6DF，𪛞𪛟）	第二辅助平面	2
		4漢字（U+2B735–U+2B738，𫜵𫜶𫜷𫜸）	第二辅助平面	4
2022	15.0	中日韓統一表意文字擴展區H（U+31350–U323AF）	第三輔助平面	4192	97059
2022	15.0	1漢字（U+2B739，𫜹）	第二辅助平面	1	97059
2023	15.1	中日韓統一表意文字擴展區I（U+2EBF0–U+2EE5F）	第二辅助平面	622	97681
2025	17.0	中日韓統一表意文字擴展區J（U+323B0–U+33479）	第三輔助平面	4316	101996
		6漢字（U+2B73A－U+2B73F，𫜺𫜻𫜼𫜽𫜾𫜿）	第二辅助平面	6
		12漢字（U+2CEA2－U+2CEAD，𬺢𬺣𬺤𬺥𬺦𬺧𬺨𬺩𬺪𬺫𬺬𬺭）	第二辅助平面	12

提交源（类别）	提交量
中国大陆（国标源）	65941
香港	17654
澳門	344
臺灣	58597
日本	16148
韩国	20739
朝鲜	23795
越南	13278
英国	2503
大藏經文本數據庫委員會	3455
統一碼協會	1019
总计	223653

類別	來源代碼	名稱	字數
中國大陸國標源（G）	G0	GB 2312-80	6763
	G1	GB 12345-90	2352（含58香港字和92吏讀字，不包括和GB 2312重複的字）
	G3	GB 7589-87繁體版本	7237
	G5	GB 7590-87繁體版本	7039
	G7	現代漢語通用字表	42（G0、1、3、5、8未包括的字）
	G8	GB 8565.2-89	290（G0、1、3、5未包括的字）
臺灣源（T）	T1	CNS 11643-1986第一字面	5401＋9計量用漢字
	T2	CNS 11643-1986第二字面	7650
	TE	CNS 11643-1986第十四字面	6319＋239中文資訊交換碼特字＋10全錄字符集（Xerox Character Code Standard，XCCS）特字
日本源（J）	J0	JIS X 0208-90	6335＋非漢字1個（仝）^[23]
日本源（J）	J1	JIS X 0212-90	5801
韓國源（K）	K0	KS C 5601-87	4888（含268重見字^[24]）
韓國源（K）	K1	KS C 5657-91	2856
委員會源（U）		KS C 5601-1987（當中重複的漢字）
		美國國會圖書館之東亞字元編碼（East Asia Character Code，簡稱EACC；標準號ANSI Z39.64-1989）^[25]
		大五碼
		中文資訊交換碼第一字面
		GB 12052-89（漢字部分）
		JEF（富士通標準）
		中國大陸電報碼
		臺灣電報碼（CCDC）
		全錄中文編碼
		人名用漢字准用字體表（人名用漢字許容字体表；日本）
		IBM選取的日本和韓國表意文字

類別	來源代碼	名稱	字數
中國大陸国标源（G）	G_KX	《康熙字典》	5357（獨有1892字）
	G_HZ	《漢語大字典》	5888（獨有339字）
	G3	GB 7589-87繁体版本	2391
	G5	GB 7590-87繁体版本	1226
	G7	現代漢語通用字表	120
	GS	新加坡漢字^[a]	226
臺灣源（T）	T3	CNS 11643-1992第三字面（原為CNS 11643-1986第十四字面）新加入字符	2178
	T4	CNS 11643-1992第四字面	2917
	T5	CNS 11643-1992第五字面	395
	T6	CNS 11643-1992第六字面	197
	T7	CNS 11643-1992第七字面	133
	TF	CNS 11643-1992第十五字面	86
日本源（J）	JA	日本資訊科技零售商統一當代表意文字（1993）	574
韓國源（K）	K2	PKS C 5700-1:1994
韓國源（K）	K3	PKS C 5700-2:1994	1834
越南源（V）	V0	TCVN 5773:1993	138
越南源（V）	V1	TCVN 6056:1995

類別	來源代碼	名稱	字數
中國大陸国标源（G）	G_KX	《康熙字典》	18486（包括在補遺篇出現的一字）
	G_HZ	《漢語大字典》	28914
	G_CY	《辭源》	66
	G_CH	《辭海》	247
	G_HC	《漢語大詞典》	553
	G_BK	《中國大百科全書》	86
	G_FZ	北大方正排版系统	65
	G_4K	《四庫全書》	522
香港源（H）	H	香港增補字符集（HKSCS）	1081
臺灣源（T）	T4	CNS 11643-1992第四字面	3408
	T5	CNS 11643-1992第五字面	8111
	T6	CNS 11643-1992第六字面	5934
	T7	CNS 11643-1992第七字面	6299
	TF	CNS 11643-1992第十五字面	6401
日本源（J）	J3	JIS X 0213:2000，level 3	25
	J3A	JIS X 0213:2004，level 3	1
	J4	JIS X 0213:2000，level 4	277
韓國源（K）	K4	PKS 5700-3:1998	166
朝鮮源（KP）	KP0	KPS 9566-97
朝鮮源（KP）	KP1	KPS 10721-2000	5766
越南源（V）	V2	VHN 01:1998	2290
越南源（V）	V3	VHN 02:1998	425

類別	來源代碼	名稱	字數
中國大陸国标源（G）	G_BK	《中國大百科全書》	74
	G_FZ	北京大学方正排版系统	1
	G_HZ	《漢語大字典》	1
	G_HC	《漢語大詞典》	14
	G_GH	《古代漢語詞典》	50
	G_GJZ	商務印書館用字	61
	G_XC	《現代漢語詞典》	25
	G_CH	《辭海》	264
	G_KX	《康熙字典》及補遺	6
	G_CYY	中國測繪科學研究院用字	55
	G_ZFY	《漢語方言大辭典》	202
	G_ZJW	《殷周金文集成引得》	366
臺灣源（T）	TC	CNS 11643-1992第12字面	634
	TD	CNS 11643-1992第13字面	767
	TE	CNS 11643-1992第14字面	350
澳門源	MAC	澳門資訊系統字集（Colectânea dos Caracteres Chineses dos Sistemas Informáticos de Macau）	16
日本源（J）	JK	日本國字集（Japanese KOKUJI Collection）	367
韓國源（K）	K5	韓國表意文字小組漢字集第五版（2001，Korean IRG Hanja Character Set 5th Edition: 2001）	404（當中主要包含古代字例）
朝鮮源（KP）	KP1	KPS 10721:2003	5357（獨有1892字）
越南源（V）	V4	《喃字詞典》（Từ điển chữ Nôm）［阮光紅（Nguyễn Quang Hồng），2006］
		《岱喃字字典》（Từ điển chữ Nôm Tày，Hoàng Triều Ân，2006）
		《沔南喃字榜查》（Bảng tra chữ Nôm miền Nam，Vũ Văn Kính，1994）
委員會源（U）		ABC Chinese-English Dictionary（德范克，John DeFrancis等，第二版（1998），火奴魯魯：夏威夷大學出版社）
		耶穌基督後期聖徒教會香港分會用字
		Mathews' Chinese-English Dictionary（Robert H. Mathews（1975），劍橋：哈佛大學出版社）
		宋本《廣韻》
		《中國鳥類系統檢索》（鄭作新等，北京：科學出版社，2000）
		段玉裁《說文解字注》

类别	来源代码	名称	字数
中國大陸国标源（G）	G_BK	《中国大百科全书》	15
	G_CH	《辞海》	112
	G_CY	《辞源》	3
	G_CYY	中国测绘科学院用字（地名用字）	98
	G_DZ	地質出版社用字	1
	G_GH	《古代汉语词典》	176
	G_HC	《汉语大词典》	7
	G_IDC	公安部身份证系统人名和地名用字	36
	G_JZ	商务印书馆用字	147
	G_KX	《康熙字典》	22
	G_RM	人民日報用字	3
	G_WZ	漢語大詞典出版社用字	12
	G_XC	《现代汉语词典》	57
	G_XH	《新華字典》	4
	G_ZFY	《汉语方言大辞典》	712
	G_ZJW	《殷周金文集成引得》	1410
臺灣源（T）	TC	CNS 11643-1992第12平面323字（台湾人名用字）	323
	TD	CNS 11643-1992第13平面595字（台湾人名用字）	595
	TE	CNS 11643-1992第14平面339字（台湾人名用字）	339
日本源（J）	JK	日本国字集	415
澳門源（M）	MAC	澳門資訊系統字集	48
委員會源（U）	UTC	从各处收集到的未收录汉字	227
越南源（V）	V4	《喃字詞典》（Từ điển chữ Nôm）［阮光紅（Nguyễn Quang Hồng），2006］	1028
		《岱喃字字典》（Từ điển chữ Nôm Tày，Hoàng Triều Ân，2006）
		《沔南喃字榜查》（Bảng tra chữ Nôm miền Nam，Vũ Văn Kính，1994）

类别	来源代码	名称	字数
中國大陸国标源（G）	G_CY	《辞源》	122
	G_FC	《现代汉语规范词典》	27
	G_IDC	公安部身份证用字	1
	G_LGYJ	《壮族嘹歌研究》	1
	G_OCD	《牛津英汉汉英词典》	2
	G_PGLG	《壮族民歌文化丛书·平果嘹歌》	70
	G_XHZ	《新华大字典》	51
	G_Z	《古壮字字典》	995
	G_ZJW	《殷周金文集成引得》	33
	G_ZYS	《壮族人民的文化遗产——方块壮字》《中国民族古文字研究》	2
日本源（J）	JMJ	日本文字信息基础工程	1645
韩国源（K）	KC	韩国历史情报统合系统	1793
澳門源（M）	MAC	澳門資訊系統字集	22
大藏经研究组（SAT）	USAT	《大正新修大藏经》（SAT版）	2884
委員會源（U）	UTC	从各处收集到的未收录汉字	1

类别	来源代码	名称	字数
中國大陸国标源（G）	G_HZR	《汉语大字典》（第二版）	878
	G_PGLG	《壮族民歌文化丛书·平果嘹歌》	13
	G_Z	《古壮字字典》	1191
韩国源（K）	KC	韩国历史情报统合系统（한국 역사 정보 통합 시스템）	428
臺灣源（T）	T13	CNS 11643第19字面（將設立的新平面）	347
	TB	CNS 11643第11字面	3
	TC	CNS 11643第12字面	2
	TD	CNS 11643第13字面	1
英國源（UK）	UK	IRG N2107R2	1566
大藏经研究组（SAT）	USAT	《大正新修大藏经》（SAT版）	329
委員會源（U）	UTC	从各处收集到的未收录汉字	239

涵蓋範圍

名稱

歷史

版本

成員機構

收字來源

总计

最初期統一漢字

擴展A區

擴展B區

統一碼4.1漢字

統一碼5.1漢字

擴展C區

擴展D區

擴展E區

急用漢字

擴展F區

擴展G區

擴展H區

扩展I区

漢字統合

理論基礎

三個原則

原字集分離原則

起源不同原則

第三個統合原則

對異體字的處理不一致

後續發展

Unihan資料庫

批評

對異體字的處理

收字過少

收字過多

準則矛盾

漢字「〇」

已統一漢字

未統一漢字

技術問題

擴展B區

参见

注释

参考文献

外部連結