Loading AI tools
来自维基百科,自由的百科全书
中華民國教育部在1973年(民國62年)委託國立臺灣師範大學國文研究所成立專案小組,負責研訂國民常用字及標準字體。經長期的研訂和試用,在1982年(民國71年)正式啟用《常用國字標準字體表》,共計收錄4808個字[1][2]。在1996年(民國85年),教育部公佈《常用國字標準字體筆順手冊》,用國字標準字體說明常用字的筆順。
教育部國家教育研究院負責維護的《異體字字典》附錄收有〈正字表〉。該表依據教育部常用字、次常用字、罕用字三個標準字體表訂定;遇有具獨立音義而三字表未收之字形,則補收為新正字。聯綿詞為描摹語音而設,故有多種字形,其異形之用字,原則上均視為獨立正字,除非文獻明示正異關係或字構可見孳乳線索[4][5]。據《異體字字典》正式七版(2024年)所收正字編錄,計收29,920字。
1973年2月,由「國字整理小組」擴編的「常用國字編纂處」在林尹、周何、李鍌、陳新雄、李殿魁、張文彬、于大成、王熙元、胡自逢、許錟輝、黃永武、黃慶萱等文字學學者的領導下,著手進行常用標準國字的整理工作。其收字及選字標準為,從中文大辭典編纂處 「總字表」(49905字)、師大國文研究所「常用字表」(2408字)及教育部「國民學校常用字彙表」(4864字)中,合併統計其總出現次數,再參酌各方意見修訂而成[4][6][1][7]。
編纂團隊繼續研訂出次常用國字10740字。在參酌各方意見後,依使用頻率,區分為《次常用國字標準字體表》(乙表)6341字(含單位詞9字)以及《罕用字體表》(丙表)4399字。甲、乙、丙三表之異體字,則另立《異體字表》(丁表)來收納,以便檢索查找[4]。
乙表的選字原則為:
編纂團隊研議擴充《罕用字體表》,丙表從原本的4399字增加為18388字(若含附錄字18字、補遺74字,則為18480字)[4]。
《丙表》擴充之收字審定原則為:
1980至1987年間,由中研院中美科學學術合作委員會與文建會(後升格為文化部)贊助的「資訊應用國字整理小組」發布《中文資訊交換碼》,納編53,940個漢字,包括:正體常用字4,808、正體備用字17,032、異體常用備用字11,517和正體罕用字20,583[11]。正體常用字即為《常用國字標準字體表》的4,808字[12]。
1986年,中央標準局公佈《通用漢字標準交換碼》(後更名為《中文標準交換碼》)納編「常用及次常用字」,共計13,051字,成為中文資訊處理交換碼納編字數的國家標準[1]。該標準的第一字面字集(5,401字)編入《常用國字標準字體表》及常見的「國中小教科書常用字」,第二字面字集(7,650字)編入《次常用國字標準字體表》及使用頻率較高的「罕用國字」[13]。《中文標準交換碼》日後陸續擴編,目前大約有96,600多個漢字[14][15]。繁體中文資訊處理編碼的業界標準五大專案碼則是以《通用漢字標準交換碼》的前身「常用字碼集」為藍本而設計,於1983年12月推出[16]。
教育部在公開招標評比後,於1991年委託華康科技公司製作《常用字表》及《次常用字表》楷、宋、黑、隸等體的電腦母稿。1993年6月,教育部公布了《國字標準字體楷書母稿》及《國字標準字體宋體母稿》。隔年,教育部發布其電子字型檔[1]。1998年公布《國字標準字體方體母稿》(方體指不含圓體的黑體)和《國字隸書母稿》。1999年公布《國字標準字體宋體母稿增補編》。
中央標準局所公佈的《通用漢字標準交換碼》(後更名為《中文標準交換碼》,CNS11643)與1984年發布的業界事實標準五大碼 (Big5) 有些許共同之處:兩者都使用國字標準字體表為基礎,但是《中文標準交換碼》所定義的碼位更符合國字標準字體表所選定的字形。國字標準字體表本身並未定義字形的碼位,而是依賴於其他標準將字形賦予碼位。
其中,五大碼與現在的《中文標準交換碼》有部分收字差異:
國字 | 字表序號[18] | CNS11643 | Big5收錄異體 | 備註 |
---|---|---|---|---|
U+5F5E彞 | A01266 | 1-7641 | C255,U+5F5D彝 | |
U+53C4叄 | B00287 | 3-3455 | 五大碼未收錄 | |
U+564D噍 | B00439 | 3-4B43 | 五大碼未收錄 | |
U+36B7㚷 | B00635 | 3-2847 | 五大碼未收錄 | |
U+5B0E嬎 | B00715 | 3-4B5F | E955,U+5B14嬔 | CNS11643 第二字面 2-565F 疑似誤收 U+5B14嬔 字,但是顯示為無點的 U+5B0E嬎 |
U+5C14爾 | B00760 | 3-223F | 五大碼未收錄 | |
U+3BA3㮣 | B01783 | 3-4167 | 五大碼未收錄 | |
U+7934礴 | B03027 | 2-662B | F2A1,U+7921礡 | 疑似 Unicode 統合時錯誤對應到統合漢字 U+7921礡 上 |
U+7DF5緵 | B03452 | 3-4E2B | EDDB,U+7E4C繌 | CNS11643 第二字面 2-5E48 疑似誤收 U+7E4C繌 字 |
U+9638阸 | B05531 | 4-2833 | 五大碼未收錄 | |
U+9C0C鰌 | B05989 | 3-5D76 | 五大碼未收錄 |
2000年,教育部出版《國小學童常用字詞調查報告書》[19],該研究透過對學童常用讀物的字頻和詞頻統計,調查出當時國小學生常用的5,021字。該報告書後來編纂為《教育部常用字庫辭典》,成為教育部識字量測驗的資料庫來源。
2012年,中華文化總會推出中華語文知識庫,其「漢字源流彙編」收錄常用漢字3,000字,並依次列舉甲骨文、金文、 戰國文字、小篆、隸書、楷書六種字體,說明漢字形體之演變[20]。
2013年,教育部委託國家教育研究院推動「建置應用語料庫及標準體系」的華語文教育計畫。研究團隊召開多次學者專家的諮詢會議,又依據語料庫的統計成果並徵求資深華語文教師的意見,在2020年完成了「臺灣華語文能力基準」的訂定,作為非母語人士學習華語的能力指標及分級標準之憑據。該指標分為三等七級,其字表部份總計收錄3,100字[21]。
2018年,國家教育研究院出版《九十九年常用語詞調查報告書》和《一○○至一○四年常用語詞調查報告書》,調查2010年至2015年採錄語料的字頻、詞頻,並和《常用國字標準字體表》加以比較。以2015年為例,其字頻表採集到5,289字,字頻10以上的字數為3,404字,而《常用國字標準字體表》未收錄但字頻達10以上之高頻字,共計117字。另外,在2010年至2015年各年度的字頻表中,字頻10以上的字數,介於3,269字至3,410字之間。與教育部《常用國字標準字體表》比較,每年均出現而未收錄於該表的高頻單字有21 個[22]。
根據教育部在1994年委託執行的「我國失學國民脫盲識字標準及脫盲識字字彙之研究」,台灣一般成人日常生活所需之基本字彙為2,328字,基本字為1659字,次基本字為669字。凡解讀日常生活基本字彙之能力在 470 個字以下者,列為「不識字」;能認 870 個字以上,而未達 1,680 字者為「半識字」;能認 1,680 字,並具有書寫日常生活之簡單應用文字能力者為「識字者」,可視為脫離文盲。[23][24]
十二年國民基本教育課程綱要(108課綱)規定在第一學習階段(國小 1-2 年級)認識常用國字至少 1,000 字,使用 700 字。第二學習階段(國小 3-4 年級)認識常用國字至少 1,800 字,使用 1,200 字。第三學習階段(國小 5-6 年級)認識常用國字至少 2,700 字,使用 2,200 字。第四學習階段(國中 7-9 年級)認識國字至少 4,500 字,使用 3,500 字。
華語文能力測驗所參照的臺灣華語文能力基準,是為外國人學習華語所制定,規定基礎(1-3級)要瞭解246~801個漢字,進階(4-5級)要瞭解1300~1900個漢字,精熟(6-7級)要瞭解2500~3100個漢字。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.