Loading AI tools
来自维基百科,自由的百科全书
中华民国教育部在1973年(民国62年)委托台湾师范大学国文研究所成立专案小组,负责研订国民常用字及标准字体。经长期的研订和试用,在1982年(民国71年)正式启用《常用国字标准字体表》,共计收录4808个字[1][2]。在1996年(民国85年),教育部公布《常用国字标准字体笔顺手册》,用国字标准字体说明常用字的笔顺。
教育部国家教育研究院负责维护的《异体字字典》附录收有〈正字表〉。该表依据教育部常用字、次常用字、罕用字三个标准字体表订定;遇有具独立音义而三字表未收之字形,则补收为新正字。联绵词为描摹语音而设,故有多种字形,其异形之用字,原则上均视为独立正字,除非文献明示正异关系或字构可见孳乳线索[4][5]。据《异体字字典》正式七版(2024年)所收正字编录,计收29920字。
1973年2月,由“国字整理小组”扩编的“常用国字编纂处”在林尹、周何、李鍌、陈新雄、李殿魁、张文彬、于大成、王熙元、胡自逢、许锬辉、黄永武、黄庆萱等文字学学者的领导下,着手进行常用标准国字的整理工作。其收字及选字标准为,从中文大辞典编纂处 “总字表”(49905字)、师大国文研究所“常用字表”(2408字)及教育部“国民学校常用字汇表”(4864字)中,合并统计其总出现次数,再参酌各方意见修订而成[4][6][1][7]。
编纂团队继续研订出次常用国字10740字。在参酌各方意见后,依使用频率,区分为《次常用国字标准字体表》(乙表)6341字(含单位词9字)以及《罕用字体表》(丙表)4399字。甲、乙、丙三表之异体字,则另立《异体字表》(丁表)来收纳,以便检索查找[4]。
乙表的选字原则为:
编纂团队研议扩充《罕用字体表》,丙表从原本的4399字增加为18388字(若含附录字18字、补遗74字,则为18480字)[4]。
《丙表》扩充之收字审定原则为:
1980至1987年间,由中研院中美科学学术合作委员会与文建会(后升格为文化部)赞助的“资讯应用国字整理小组”发布《中文资讯交换码》,纳编53940个汉字,包括:正体常用字4808、正体备用字17032、异体常用备用字11517和正体罕用字20583[11]。正体常用字即为《常用国字标准字体表》的4808字[12]。
1986年,中央标准局公布《通用汉字标准交换码》(后更名为《中文标准交换码》)纳编“常用及次常用字”,共计13051字,成为中文资讯处理交换码纳编字数的国家标准[1]。该标准的第一字面字集(5401字)编入《常用国字标准字体表》及常见的“国中小教科书常用字”,第二字面字集(7650字)编入《次常用国字标准字体表》及使用频率较高的“罕用国字”[13]。《中文标准交换码》日后陆续扩编,目前大约有96600多个汉字[14][15]。繁体中文资讯处理编码的业界标准五大专案码则是以《通用汉字标准交换码》的前身“常用字码集”为蓝本而设计,于1983年12月推出[16]。
教育部在公开招标评比后,于1991年委托华康科技公司制作《常用字表》及《次常用字表》楷、宋、黑、隶等体的电脑母稿。1993年6月,教育部公布了《国字标准字体楷书母稿》及《国字标准字体宋体母稿》。隔年,教育部发布其电子字型档[1]。1998年公布《国字标准字体方体母稿》(方体指不含圆体的黑体)和《国字隶书母稿》。1999年公布《国字标准字体宋体母稿增补编》。
1993年,中央研究院中文词知识库小组利用“中文新闻语料库”(撷取1990-91年的联合报、中国时报、自由时报及天下杂志)编制了《新闻语料字频统计表》,并依注音编制成索引,于1995年出版《注音检索现代汉语字频表》,共计5666字[17][18]。
1997年,教育部出版《国语辞典简编本编辑资料字词频统计报告》,该研究是为编辑《国语辞典简编本》而抽取1992-93年的报刊杂志、畅销书和国中小国文课本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。该份统计报告的字频表共收录了5731字[19]。
1998年,教育部出版《八十四年常用语词调查报告书》,搜集了民国八十四年(1995年)之语料样本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。教育部之后陆续出版民国八十五年、八十六年、八十七年之《常用语词调查报告书》[20]。1999年又出版《八十七年口语语料调查报告书》,搜集口语语料样本,其字频表收字3788字[21]。
2000年,教育部出版《国小学童常用字词调查报告书》[22],该研究对当时(1998-99年)国小学童的常用读物进行字频和词频统计,并和《常用国字标准字体表》加以比较,其字频表共收录5021字。该报告书后来编纂为《教育部常用字库辞典》,成为教育部识字量测验的数据库来源。
2012年,中华文化总会推出中华语文知识库,其“汉字源流汇编”收录常用汉字3000字,并依次列举甲骨文、金文、 战国文字、小篆、隶书、楷书六种字体,说明汉字形体之演变[23]。
2013年,教育部委托国家教育研究院推动“建置应用语料库及标准体系”的华语文教育计划。研究团队召开多次学者专家的咨询会议,又依据“台湾华语文语料库”的统计成果并征求资深华语文教师的意见,在2020年完成了“台湾华语文能力基准”的订定,作为非母语人士学习华语的能力指标及分级标准之凭据。该指标分为三等七级,其字表部分总计收录3100字[24][25]。
2018年,国家教育研究院出版《九十九年常用语词调查报告书》和《一○○至一○四年常用语词调查报告书》,采录民国99年(2010年),以及民国100至104年的语料,进行字频和词频统计,并和《常用国字标准字体表》加以比较。以2015年为例,其字频表收录5289字,字频10以上的字数为3404字,而《常用国字标准字体表》未收录但字频达10以上之高频字,共计117字。另外,在2010年至2015年各年度的字频表中,字频10以上的字数,介于3269字至3410字之间。与教育部《常用国字标准字体表》比较,每年均出现而未收录于该表的高频字有21个[26]。
2020年,国家教育研究院出版《解读新闻字词:新闻媒体常用语词调查(105-107年)》,将常用语词调查从多类型文本的抽样转变为对新闻文本的大数据分析,针对报导文章进行字频和词频统计。国教院陆续出版了后续年度的《解读新闻字词:新闻媒体常用语词调查》,其中有些年度调查会和《常用国字标准字体表》加以比较。“2010年至2015年”与“2016年至2020年”两期间的调查,虽采样来源和规模不同,但各年度常用字仍大致在3300字至3400字左右。2010年至2020年的共同常用字为2861字,再和《常用国字标准字体表》比较,两者的共同收录字为2824字[27]。
根据教育部在1994年委托执行的“我国失学国民脱盲识字标准及脱盲识字字汇之研究”,台湾一般成人日常生活所需之基本字汇为2328字,基本字为1659字,次基本字为669字。凡解读日常生活基本字汇之能力在 470 个字以下者,列为“不识字”;能认 870 个字以上,而未达 1680 字者为“半识字”;能认 1680 字,并具有书写日常生活之简单应用文字能力者为“识字者”,可视为脱离文盲[28][29]。
十二年国民基本教育课程纲要(108课纲)规定在第一学习阶段(国小 1-2 年级)认识常用国字至少 1000 字,使用 700 字。第二学习阶段(国小 3-4 年级)认识常用国字至少 1800 字,使用 1200 字。第三学习阶段(国小 5-6 年级)认识常用国字至少 2700 字,使用 2200 字。第四学习阶段(国中 7-9 年级)认识国字至少 4500 字,使用 3500 字。
华语文能力测验所参照的台湾华语文能力基准(TBCL),是为外国人学习华语所制定,规定基础(1-3级)要了解246~801个汉字,进阶(4-5级)要了解1300~1900个汉字,精熟(6-7级)要了解2500~3100个汉字。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.