中华民国教育部在1973年(民国62年)委托台湾师范大学国文研究所成立专案小组,负责研订国民常用字及标准字体。经长期的研订和试用,在1982年(民国71年)正式启用《常用国字标准字体表》,共计收录4808个字[1][2]。在1996年(民国85年),教育部公布《常用国字标准字体笔顺手册》,用国字标准字体说明常用字的笔顺。
教育部正字及异体字表
- 常用国字标准字体表,简称甲表,ISBN 9789570906646,教育部于1978年5月印行,内附“教育部社会教育司委托国立台湾师范大学国文研究所研订常用国字及标准字体总报告”。收到各界意见修订后,委由正中书局于1979年6月出版,于1982年9月1日作为常用字和字体标准正式启用,内收4808字。
- 次常用国字标准字体表,简称乙表,ISBN 9786660913003,于1982年10月印行,12月出版的次常用字和字体标准,内收6341字。1993年公布的《国字标准字体楷书母稿》中,次常用字为6343字。在最新版的《异体字字典》附录,次常用字更订为6329字[3]。
- 罕用国字标准字体表,简称丙表,ISBN 9786660913010,于1983年10月印行,隔年4月出版的的罕用字和字体标准,内收18388字。在最新版的《异体字字典》附录,罕用字更订为18318字。
- 异体国字字表,简称丁表,于1984年3月印行的异体字标准,内收异体18588字,补遗22字。在最新版的《异体字字典》附录,收异体字74381字。
教育部国家教育研究院负责维护的《异体字字典》附录收有〈正字表〉。该表依据教育部常用字、次常用字、罕用字三个标准字体表订定;遇有具独立音义而三字表未收之字形,则补收为新正字。联绵词为描摹语音而设,故有多种字形,其异形之用字,原则上均视为独立正字,除非文献明示正异关系或字构可见孳乳线索[4][5]。据《异体字字典》正式七版(2024年)所收正字编录,计收29920字。
研订方法
1973年2月,由“国字整理小组”扩编的“常用国字编纂处”在林尹、周何、李鍌、陈新雄、李殿魁、张文彬、于大成、王熙元、胡自逢、许锬辉、黄永武、黄庆萱等文字学学者的领导下,著手进行常用标准国字的整理工作。其收字及选字标准为,从中文大辞典编纂处 “总字表”(49905字)、师大国文研究所“常用字表”(2408字)及教育部“国民学校常用字汇表”(4864字)中,合并统计其总出现次数,再参酌各方意见修订而成[4][6][1][7]。
- 常用字资料来源及其出现次数表:从“总字表”出现次较多之字挑选出7980字,结合“常用字表”,并合并“国民学校常用字汇表”[注 3]之字频统计。
- 国民常用字调查表:以“常用字资料来源及其出现次数表”选定之7980字为基础,将“常用字表”与“国民学校常用字汇表”二者出现次的总和作为总出现次。依出现总次的高低排序,合并正俗字,选出其中最常用的4708字制成,此为初步统计结果。1978年(民国67年)教育部参酌各方意见将字表增订至4808字,定名为《常用国字标准字体表》。
编纂团队继续研订出次常用国字10740字。在参酌各方意见后,依使用频率,区分为《次常用国字标准字体表》(乙表)6341字(含单位词9字)以及《罕用字体表》(丙表)4399字。甲、乙、丙三表之异体字,则另立《异体字表》(丁表)来收纳,以便检索查找[4]。
乙表的选字原则为:
编纂团队研议扩充《罕用字体表》,丙表从原本的4399字增加为18388字(若含附录字18字、补遗74字,则为18480字)[4]。
《丙表》扩充之收字审定原则为:
字元编码及字体电脑化
1980至1987年间,由中研院中美科学学术合作委员会与文建会(后升格为文化部)赞助的“资讯应用国字整理小组”发布《中文资讯交换码》,纳编53940个汉字,包括:正体常用字4808、正体备用字17032、异体常用备用字11517和正体罕用字20583[11]。正体常用字即为《常用国字标准字体表》的4808字[12]。
1986年,中央标准局公布《通用汉字标准交换码》(后更名为《中文标准交换码》)纳编“常用及次常用字”,共计13051字,成为中文资讯处理交换码纳编字数的国家标准[1]。该标准的第一字面字集(5401字)编入《常用国字标准字体表》及常见的“国中小教科书常用字”,第二字面字集(7650字)编入《次常用国字标准字体表》及使用频率较高的“罕用国字”[13]。《中文标准交换码》日后陆续扩编,目前大约有96600多个汉字[14][15]。繁体中文资讯处理编码的业界标准五大专案码则是以《通用汉字标准交换码》的前身“常用字码集”为蓝本而设计,于1983年12月推出[16]。
教育部在公开招标评比后,于1991年委托华康科技公司制作《常用字表》及《次常用字表》楷、宋、黑、隶等体的电脑母稿。1993年6月,教育部公布了《国字标准字体楷书母稿》及《国字标准字体宋体母稿》。隔年,教育部发布其电子字型档[1]。1998年公布《国字标准字体方体母稿》(方体指不含圆体的黑体)和《国字隶书母稿》。1999年公布《国字标准字体宋体母稿增补编》。
中央标准局所公布的《通用汉字标准交换码》(后更名为《中文标准交换码》,CNS11643)与1984年发布的业界事实标准五大码 (Big5) 有些许共同之处:两者都使用国字标准字体表为基础,但是《中文标准交换码》所定义的码位更符合国字标准字体表所选定的字形。国字标准字体表本身并未定义字形的码位,而是依赖于其他标准将字形赋予码位。
其中,五大码与现在的《中文标准交换码》有部分收字差异:
国字 | 字表序号[18] | CNS11643 | Big5收录异体 | 备注 |
---|---|---|---|---|
U+5F5E彝 | A01266 | 1-7641 | C255,U+5F5D彝 | |
U+53C4叁 | B00287 | 3-3455 | 五大码未收录 | |
U+564D噍 | B00439 | 3-4B43 | 五大码未收录 | |
U+36B7㚷 | B00635 | 3-2847 | 五大码未收录 | |
U+5B0E嬎 | B00715 | 3-4B5F | E955,U+5B14嬔 | CNS11643 第二字面 2-565F 疑似误收 U+5B14嬔 字,但是显示为无点的 U+5B0E嬎 |
U+5C14尔 | B00760 | 3-223F | 五大码未收录 | |
U+3BA3㮣 | B01783 | 3-4167 | 五大码未收录 | |
U+7934礴 | B03027 | 2-662B | F2A1,U+7921礡 | 疑似 Unicode 统合时错误对应到统合汉字 U+7921礡 上 |
U+7DF5緵 | B03452 | 3-4E2B | EDDB,U+7E4C繌 | CNS11643 第二字面 2-5E48 疑似误收 U+7E4C繌 字 |
U+9638阸 | B05531 | 4-2833 | 五大码未收录 | |
U+9C0C䲡 | B05989 | 3-5D76 | 五大码未收录 |
其他
2000年,教育部出版《国小学童常用字词调查报告书》[19],该研究透过对学童常用读物的字频和词频统计,调查出当时国小学生常用的5021字。该报告书后来编纂为《教育部常用字库辞典》,成为教育部识字量测验的资料库来源。
2012年,中华文化总会推出中华语文知识库,其“汉字源流汇编”收录常用汉字3000字,并依次列举甲骨文、金文、 战国文字、小篆、隶书、楷书六种字体,说明汉字形体之演变[20]。
2013年,教育部委托国家教育研究院推动“建置应用语料库及标准体系”的华语文教育计画。研究团队召开多次学者专家的谘询会议,又依据语料库的统计成果并征求资深华语文教师的意见,在2020年完成了“台湾华语文能力基准”的订定,作为非母语人士学习华语的能力指标及分级标准之凭据。该指标分为三等七级,其字表部份总计收录3100字[21]。
2018年,国家教育研究院出版《九十九年常用语词调查报告书》和《一○○至一○四年常用语词调查报告书》,调查2010年至2015年采录语料的字频、词频,并和《常用国字标准字体表》加以比较。以2015年为例,其字频表采集到5289字,字频10以上的字数为3404字,而《常用国字标准字体表》未收录但字频达10以上之高频字,共计117字。另外,在2010年至2015年各年度的字频表中,字频10以上的字数,介于3269字至3410字之间。与教育部《常用国字标准字体表》比较,每年均出现而未收录于该表的高频单字有21 个[22]。
标准、课纲和华语考试
根据教育部在1994年委托执行的“我国失学国民脱盲识字标准及脱盲识字字汇之研究”,台湾一般成人日常生活所需之基本字汇为2328字,基本字为1659字,次基本字为669字。凡解读日常生活基本字汇之能力在 470 个字以下者,列为“不识字”;能认 870 个字以上,而未达 1680 字者为“半识字”;能认 1680 字,并具有书写日常生活之简单应用文字能力者为“识字者”,可视为脱离文盲[23][24]。
十二年国民基本教育课程纲要(108课纲)规定在第一学习阶段(国小 1-2 年级)认识常用国字至少 1000 字,使用 700 字。第二学习阶段(国小 3-4 年级)认识常用国字至少 1800 字,使用 1200 字。第三学习阶段(国小 5-6 年级)认识常用国字至少 2700 字,使用 2200 字。第四学习阶段(国中 7-9 年级)认识国字至少 4500 字,使用 3500 字。
华语文能力测验所参照的台湾华语文能力基准(TBCL),是为外国人学习华语所制定,规定基础(1-3级)要了解246~801个汉字,进阶(4-5级)要了解1300~1900个汉字,精熟(6-7级)要了解2500~3100个汉字。
注释
参考文献
参见
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.