Loading AI tools
漢字文化圈使用之表語書寫系統 来自维基百科,自由的百科全书
漢字(日語:漢字/かんじ Kanji */?,韓語:한자/漢字 hanja;越南語:hán tự/chữ hán/漢字/𡨸漢),又稱漢文、華文、華語字、唐話字、唐人字、中國字,是書寫漢語所使用的文字系統[13][14],也是現今世界上唯一仍廣泛使用的語素文字[15],主要流行於漢字文化圈(特別是大中華地區),也是聯合國四種官方文字之一(另外三種皆為拼音文字,分別是英語、法語與西班牙語使用的拉丁文字、俄語使用的西里爾文字和阿拉伯語使用的阿拉伯文字)。
漢字 | |
---|---|
類型 | |
使用時期 | 約公元前2500年至今 |
書寫方向 | 橫排從左到右,從上到下(現代) 豎排從上到下,從右到左(傳統) |
語言 | 漢語族語言/漢語方言(文言 、官話、粵語、閩語、客家話、贛語、湘語、吳語、晉語、徽語等)、白語、壯語[a]、日語、琉球語、韓語、越南語等[b] |
相關書寫體系 | |
父體系 | (原始文字)
|
子體系 | 假名、諺文、喃字、契丹文、方塊壯字、女真文、注音符號等 |
ISO 15924 | |
ISO 15924 | Hani (500), Han (Hanzi, Kanji, Hanja) Hans(簡體) Hant(正體) |
Unicode | |
別名 | Han |
範圍 | U+4E00至U+9FFF[1] U+3400至U+4DBF[2](擴充A區) |
漢字 | |||||||||||||||||||||||||||||||||||||||
漢語名稱 | |||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
正體字 | 漢字 | ||||||||||||||||||||||||||||||||||||||
簡化字 | 汉字 | ||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||
越南語名稱 | |||||||||||||||||||||||||||||||||||||||
越南語 | Hán tự - Chữ Hán | ||||||||||||||||||||||||||||||||||||||
喃字 | 漢字 - 𡨸漢 | ||||||||||||||||||||||||||||||||||||||
壯語名稱 | |||||||||||||||||||||||||||||||||||||||
壯語 | 倱[12] Sawgun | ||||||||||||||||||||||||||||||||||||||
韓語名稱 | |||||||||||||||||||||||||||||||||||||||
諺文 | 한자 | ||||||||||||||||||||||||||||||||||||||
漢字 | 漢字 | ||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||
日語名稱 | |||||||||||||||||||||||||||||||||||||||
漢字 | ⓘ | ||||||||||||||||||||||||||||||||||||||
|
漢字是世界歷史上唯一被高度發展的語素文字[c],從基礎的象形字和指事字發展出了現今以形聲字和會意字為主流的六書系統,加上各類異體字和生僻字在所有字典中總共收錄超過十萬字。每個漢字在結構上由最基礎的筆畫進行二維排列組成,每個筆畫不包含任何語素,相當於表音文字的字母;由筆畫組成的偏旁部首是漢字內部結構上的最小語素單位,相當於一些表音文字的詞根。除形聲字外的漢字通常不具備音素,而形聲字的聲旁則帶有一定表音功能,但因為其大多基於上古漢語的發音所以與現代標準漢語有一些差異。現今漢字通常使用額外獨立的標音幫助閱讀,在中華民國時期主要使用注音符號,但在台灣以外的地區(特別是中國大陸)主要使用羅馬化的漢語拼音。雖然絕大多數漢字單字都擁有自身的獨立含義,在語法上相當於英文的單詞,但漢語詞彙通常都是由兩個以上單字組成的合成詞。
漢字最初由中國上古時代的黃河文明華夏族所發明創製,其字體歷經長久改進及演變。目前漢字確切出現的歷史尚有爭議,最早可追溯至約公元前2500年、早於夏朝的陶文,成熟於公元前1300年的商朝的甲骨文、金文以及西周的籀文,再到春秋戰國的大篆,最終在秦朝統一天下後推行書同文被標準化為小篆,至漢朝發生隸變產生與現代漢字已形無大異的隸書,並於魏晉南北朝時期演變成楷書和衍生自書法風格的行書和草書,在唐代因雕版印刷的出現成為今日手寫的穩定標準——正楷,再發展到宋朝因活字印刷的普及變成至今出版物仍常用的宋體和仿宋體。現代漢字大體分為傳統漢字(反稱為正體字)與簡化字(簡體字)兩大標準,前者主要用於台灣以及香港、澳門等地區,後者則由中國大陸在1950年代制定並使用,後為新加坡、馬來西亞等海外華人眾多的國家採用。在非漢語體系中,日本將部分日文漢字自行作簡後,成為現在的日本新字體;大韓民國也製定了官方的朝鮮漢字使用規範,而史上曾使用過漢字的朝鮮、越南、蒙古等國,漢字已不再具有官方地位。
漢字是人類迄今為止連續使用時間最長的主要書寫系統,也是唯一廣泛應用至今的音意文字——相比之下,其他曾興盛一時的文明古國文字(如古埃及的聖書體、巴比倫的楔形文字、古印度的印度河文字與婆羅米文字等[d])都早已消亡,其餘一些仍尚存的古典文字(如拉丁文、古希臘文和梵文)也早已淪落成為在宗教和學術領域之外無人日常使用的死語。中國歷朝歷代皆以漢字為主要書寫文字,在中華治世的很長時期內還充當東亞地區唯一的國際通用文字,在19世紀和20世紀各國因中國孱弱而先後去中國化之前都是朝鮮半島、越南、日本和琉球等國家實質上的書面規範文字。除了直接借用漢字外,古代東亞諸國還均有基於漢字偏旁的自創文字,如日文片假名和越語喃字等,但現今只有片假名仍被使用。如今漢字仍是中華人民共和國和新加坡的官方文字,此也是多數國際組織(例如聯合國、上海合作組織等)的工作文字,加上這些國際組織在1971年聯合國大會第2758號決議後出於「一個中國」政策均採用簡體字為正式文字,以及21世紀初中國崛起等原因,所以現今多數國家的外國人如學習中文均以簡體為主。大部分非港澳台的華人只在少數情況下(如研究中國歷史、研究古代漢語、派駐港澳台地區等)才會學習正體字,但「識繁寫簡」的提倡在除台灣以外的大中華地區已獲得了不少支援[16]。
「漢字」一詞最早出自元朝《金史》卷九本紀第九,「章宗一」:「十八年,封金源郡王。始習本朝語言小字,及漢字經書,以進士完顏匡、司經徐孝美等侍讀」。《金史》也出現多次,如:「女真初無文字,及破遼,獲契丹、漢人,始通契丹、漢字,於是諸子皆學之」、「長子布輝,識女真、契丹、漢字,善騎射」,將漢族文字、女真族文字、契丹族文字之間互相區別。
在清朝前期,政府官方文字是滿文,當時已用「漢字」一詞稱呼中國漢族的傳統文字。另外,日本人也稱呼為「漢字」,以別於由漢字衍生的假名。在李氏朝鮮,「漢字」則與訓民正音(諺文)相區別。在越南,「漢字」則與由漢字衍生的喃字相區別。在琉球國,「漢字」則與琉球國字頭相區別。
傳說漢字起源於倉頡造字。根據《淮南子》的記載,黃帝的右史官倉頡根據日月形狀、鳥獸足印創造了文字,使而「天雨粟,鬼夜哭」。但從歷史的角度看,複雜的漢字系統不可能由一人發明,倉頡應該是在漢字的蒐集、整理、統一上作出了突出貢獻,所以後來荀子在其《荀子·解蔽》中對此評論認為「好書者眾矣,而倉頡獨傳者,壹也」。
文字發明前的口頭知識在傳播和積累中有明顯缺點,原始人類使用了結繩、刻契、圖畫的方法輔助記事,後來用特徵圖形來簡化、取代圖畫。當圖形符號簡化到一定程度,並形成與語言的特定對應時,原始文字就形成了。唐蘭在《古文字學導論》中將古文字分成殷商系、西周系、六國系、秦系四系。
1994年,湖北楊家灣大溪文化遺址出土了大量陶器。在這些6000年前的陶器上發現了170多種符號,部分符號的特徵與甲骨文很類似。此外,山東大汶口出土陶器上的象形符號、西安半坡彩陶上的半坡陶符以及河南賈湖遺址發現的距今8000年前的龜甲上的賈湖契刻符號等,都可能是原始文字形成中(或形成前)不同階段的表現。但是,這些幾何符號是否是文字、是否是漢字前身,這些仍是爭議頗多的問題。
中華人民共和國考古學者王恩田與俞偉超等人認為,在龍山文化中發現的丁公陶文,是東夷系統的文字[17]。馮時認為,丁公陶文屬於古彝文系統,殷商甲骨文中的人方以及西周所稱的東夷,可能與彝族有關[18]。李象潤、李浴洋等大多數學者認為,丁公陶文屬於古漢字系統[19][20]。
從甲骨文到小篆,漢字經歷了從鉅細靡遺描繪意象的方式,往簡化成容易紀錄刻畫的方向變遷,字形逐步脫離事物的具體形象。這一時期的漢字也稱為古文字。[e]
商周時期的甲骨文已經是比較完整的文字體系。在已發現的4500多個甲骨文單字中,目前已能認出近2000字。[21]與甲骨文同期,青銅器上鑄造的文字被稱為金文或鐘鼎文。西周時期的《散氏盤》、《毛公鼎》具備很高的史料和藝術價值。
春秋時代開始,各地諸侯相爭,而原本周文化獨尊的局面逐漸破壞,各地區文化開始有「在地化」的改變趨勢。到了戰國時代以後,這種情況更明顯,在文字使用方面可以粗略依照地域分為五大系統:東方齊系、東北燕系、南方楚系、北方晉系和西方秦系文字,各系統的文字大體上相近,只有小部份文字有所差異,因此彼此文書往來並沒有太大問題。[22]
秦始皇統一六國後,李斯在大篆(秦系文字)和六國古文的基礎上,進行規範和整理,制定出了小篆作為秦朝的標準書寫字體,統一了中國的文字,影響深遠。小篆呈長方形,筆畫圓潤流暢。小篆解決了各國文字間出現大量異體字的情況,「書同文」的歷史從此開始。文字的統一有力促進了不同語族間的文化傳播,對中國統一以及東亞各國的文化交流發揮重要作用,為世界文字史所罕見。
漢字的發展經歷了諸多演變。初期漢字系統的字數很少,以象形與指事的獨體字為主,大量事物以通假字來表示,使文字表述存在較大歧義。例如先秦的「文」,兼有後世的新字「紋」的功能,表示一組成各種事務的規律、型式,不單指文字的「文」,也包含野獸身上的花「紋」、布上面的織「紋」、手指的指「紋」等數種含意。
除了「凹」、「凸」等特例直到唐朝才發明[23],大部分的象形指事字很早就已經定型,成為下個時代形聲會意組字法的基礎。
為了能更精準的表述,最早從小篆的時代開始一直到現代,因應隨文明發展不斷增加的新事物,以基本的象形指事字為基礎,發展了形聲、會意的組字法,以組合方式,來細化大量的字出來,使得文書上記載越來越精密,一直為造字主力。
例如:
有了造好的象形、指事的獨體字為基礎,使用形聲、會意組字法隨著文明的發展,組出表示新事物的合體字,這使得記載為文時,以前述的各種不同的船來說,只要看一單位的字形,我們就知道指的是哪一種「舟」,這樣辨識理解的效率非常高;反過來,以組詞的方式就要看過前後文(或短或長)有其他哪些字才能判斷正確的意義,較缺乏辨識效率,但方便口語溝通(漢字同音字太多,聽覺不易辨識,解法一為組詞,二為如韓日語數音為一字:「浬」發音為海里)。
漢字非為一時、一地、一人所造,是古人共同使用流傳後的結果,受到多數人使用的字形則可流傳至今,不受流通的字形則收藏在金石古典,或消失在歷史洪流之中。因此,有的字會為了書寫簡便,省筆或速寫漸漸成為另一個筆畫少的字體,稱為「漢字簡化」;但是亦有為了使漢字能清晰辨識或加強表音、表意,而將字形增加筆畫或部件,使得該字能精準表達或是不易更動,稱為「漢字繁化」。
「漢字繁化」的首要目的是加強漢字的辨識度,避免混淆。如國字數字的大小寫中,因「一、二、三」等數字筆畫少,在書寫後容易遭到篡改而影響金額、數量等利益,除若干數字是借用筆畫較多的他字來代表數字,如以「壹」代「一」、「貳」代「二」、「伍」代「五」、「陸」代「六」、「玖」代「九」等外,另外則採增加筆畫或部件而造出的漢字數字,如「一」有「弌」、「二」有「弍」、「三」有「弎、叄、叁(亦為參之代字後變體)」、「四」有「䦉」等,在原來的漢字上再加上其他筆畫部件,而音義並未改變,是漢字繁化情形。「上」和「下」也是由古文「丄」(或「𠄞」)和「丅」(或「𠄟」)增筆繁化而成。
有些繁化現象,則爲加強字理。例如爲加強漢字標音功能而增加識音的聲符。例如「齒」字,古字作「𠚕」,是口中有牙齒的象形。可能因不易識別字音而增加聲符「止」作為標音,「𠚕」與「齒」的音和義是一樣的。又如「鬥」字形是象二個散髮動手打鬥之人,可能因不易識別字音而增加聲符「斗」、「豆」作為標音,繁化為「鬦」、「𩰒」[24],而「鬥」與「鬦」、「𩰒」的音和義是一樣的。如此字義並無改變,繁化是為了能增加該字的標音功能。又例如替漢字增加義符,像「華」的古字並無上方的「艹」,本身是花朵的象形,後來增添義符「艹」表示類屬。又如「舂」、「舊」等字所含有的「臼」字,甲骨文只作「凵」,像凹陷下去的形狀,然而這形狀也很容易被理解作地面凹陷下去;因此金文就在「凵」內加像米粒、穀粒的小點,增強它的象形成份,使「臼」義明顯。
另外,亦有漢字造字的繁化現象。漢字作為古人識別萬事萬物的工具,然而人事物眾多,漢字卻有限,若將萬事萬物都造一字表示,則漢字數量過於龐大,如古時以馬作為生活交通工具,為不同類型的馬造出許多漢字,如「驤(xiāng、ㄒㄧㄤ):後右蹄白色的馬」、「馵(zhù、ㄓㄨˋ):後左腳白色的馬」、「騚(qián、ㄑㄧㄢˊ):四蹄全白的馬」等字,大量增加馬部專屬的漢字,雖能特定、精準地專指某種馬匹的意思,至今卻鮮少使用。因此,一般仍是以一個漢字具備多項意義來運用,再由一個漢字沿伸出多個漢字,稱為「漢字繁化」。而相同字義的漢字繁化,為漢字同源詞中的「累增字」,繁化後產生不同意義者為漢字同源詞中的「後起字」及「孳乳字」。
此處與「簡體字」(「相同字義而筆畫減省」的漢字)相對,故僅論述「相同字義而筆畫增繁」的漢字,即「累增字」,指原字雖已造,然而該字借給他用後對於表達原事物的意義漸漸不清,故再增加表意部件來表達原字意義,如「止」本意為腳趾,後世多借用此字表示「停留」義,於是加「足」繁化為「趾」以示本義;「然」本意為燃燒,後多將其用作虛詞,原義加「火」繁化為「燃」;「它」本意為蛇,但逐漸用作代詞,本義則加「虫」部繁化為「蛇」。
漢字結構複雜,異體字非常多。自古以來已經有許多的俗字,其中有一些是爲了書寫簡便,較之正字筆畫減少的簡俗字,但俗字多半是人民私下使用,正式的文書仍然是用正體字。
近代,處於強勢地位的西方文明開始進入東亞,整個漢字文化圈的各個國家中紛紛掀起了學習西方的思潮。當中有人堅持漢字的傳統,亦有鼓吹放棄使用漢字。這些鼓吹放棄漢字運動的立論「漢字落後論」,內容為:跟西方拼音文字相比,漢字是繁瑣笨拙的。尤其在近代個人電腦還沒有普遍化以前,因為漢字不能透過打字機書寫,而必須使用巨型的排版房的鉛字,也就是說漢字已成為教育及資訊化上的瓶頸。但是近代個人電腦普遍化以後,漢字能透過個人電腦輸入,此種論述已經不具說服性。許多使用漢字國家以政治推行的方式,進行了不同程度的漢字簡化,甚至還有完全拼音化的嘗試。日本的使用假名方案以及漢語多種拼音方案的出現都是基於這種考量。
對於「漢字簡化」,執行的對象有民間及官方二種。在民間百姓寫字只為紀錄或交流,不需要嚴格遵守筆畫規範,因為漢字筆畫多,在書寫時會有連筆、省筆以求快速書寫是古今皆有的現象,如將「貝」、「見」、「且」、「直」等有框中二橫、三橫的筆畫直接以一直筆代替,這是民間漢字簡化的情形,加上普遍在社會中流通,成為民間「手頭字」、「俗字」;而官方的「漢字簡化」則是由政府以公權力進行並頒布實施。
1935年8月21日,中華民國國民政府教育部頒布《第一批簡體字表》,1936年2月被通令「暫緩推行」。
中華人民共和國政府1956年1月28日發布《漢字簡化方案》,1964年5月審定通過《簡化字總表》,客觀上配合了不久之後的文化大革命「破四舊」政策。1986年經少量修訂後重新發表,一直在中國大陸地區使用至今。1977年,曾公布《第二批漢字簡化方案(草案)》,發布「二簡字」,試用一段時間(約八年)後因為字形過於簡陋且混亂而停用,並於1986年正式宣布廢除。新加坡和馬來西亞政府分別發布了同中國大陸《簡化字總表》相同的簡化字表。
日本政府在二戰結束後也進行了漢字簡化。1946年日本內閣公佈了《當用漢字表》,收字1850個,其中對部分漢字進行了簡化,有些簡化後的漢字與中國大陸簡化後的漢字一致,有些則有一定差異,部分為日本自創。
小篆筆畫以曲線為主,後來逐步變得直線特徵較多、更容易書寫。到漢代,隸書取代小篆成為主要書體。漢代以後,漢字的書寫方式逐步從木簡和竹簡,發展到在帛、紙上的毛筆書寫。隸書的出現,奠定了現代漢字字形結構的基礎,成為古今文字的分水嶺。隸書進一步發展爲楷書,到唐代,楷體完全定形。除端正的楷書外,亦同時衍生出適於手寫的行楷,並進一步衍生出筆畫更加簡省而飛動的草書。楷書、行書、草書等書體都發展爲藝術。古代印刷術發明後,明朝出現了用於印刷的宋體、民初出現仿宋體,宋體亦傳入日本、韓國等使用漢字的國家,同樣成爲當地通行的漢字印刷體。現代手寫體仍以楷體為標準(鋼筆字),除了傳統的宋體外,現代又陸續出現了筆畫大小粗細均衡的黑體等字形。
在紙張被發明之前,漢字通常寫在竹簡上。因此,傳統漢字書寫方向爲從上往下,從右往左的豎排格式。自二十世紀中葉,越來越多的漢語出版社開始使用橫排發行刊物,尤其是有關科學技術的期刊(橫排便於書寫數學公式和化學表達式,並且便於穿插同爲橫排書寫的西方字元)。
漢字的特點如下:
六書是漢字組字的基本原理,在周禮中就有提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》中,詳細闡述了「六書」這個漢字構造原理:象形、指事、會意、形聲、轉注、假借。
這種造字法是依照物體的外貌特徵來描繪出來,所謂「畫成其物,隨體詰詘」是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成現在的造型。
這是指表現抽象事情的方法,所謂「各指其事以為之」是也。如人在其上寫作「上」,人在其下寫作「下」,有人稱為抽象的象形。
這個造字法,是將兩個字根組合起來,使衍生出新的含意。如「日」和「月」組起來,就是日光加月光變成「明」。「人」字和「言」字合成「信」字,意思就是人過去所言;有信,就是這個人都很遵守自己說過的話。
此乃文字內以特定形狀(字根)表特有的音。例如:胡,這個字也可為一個聲符,結合不同的屬性部件,表不同意義如蝴、湖、葫、瑚、醐等,而以同樣的發音元素(也有的是完全同音),表達不同的事物。但形聲字,也因古今語言音韻變遷,不少古代同類形聲字在今天的官話已無共同音素了,如過、蝸。
六書中轉註爭議最大。漢代許慎《說文解字》中對轉註的定義是:「建類一首,同意相受,考、老是也。」有人解釋這句話的意思是:轉註是用於兩個字互為註釋,彼此同義而不同形,如「老」、「考」二字。古時「考」可作「長壽」講,「老」、「考」相通,意義一致,即所謂「老者考也,考者老也」。詩經的《大雅·棫樸》亦云:「周王壽考。」。蘇軾的《屈原塔詩》也有「古人誰不死,何必較考折。」一語。其中的「考」皆「老」意。由於許慎對轉註定義模糊,《說文解字》一書中除此例以外再無其他字被記載為轉註字,因此,後代的文字學家針對許慎的前述的定義有許多解釋和爭議。其中包括「形轉說、聲轉說、義轉說」三類,只是這三種說法有人認為不夠全面。當代古文字家林沄認為「轉注」就是一個形體(字根)記錄兩個讀音和意義完全不同的兩個詞,例如「帚和婦」與甲骨文中的「母和女」等等。亦有觀點認為轉註不是解釋漢字字源必須的概念,中國著名文字學家、北京大學教授裘錫圭先生認為:「在今天研究漢字,根本不用去管轉注這個術語。不講轉注,完全能夠把漢字的構造講清楚。……總之,我們完全沒有必要捲入到無休無止的關於轉註定義的爭論中去。」[26]
這法簡言之,借用一字去表達別的事物。一般來說,是有一個無法描述的新事物,就借用一個發音接近或是屬性近似的字根,來表達這個新事物。例如:「又」,本來是指右手(最早可見於甲骨文)[27],但後來被假借當作別的意思。聞,本意是用耳朵聽東西的意思。例如《大學‧第七章》中有「視而不見,聽而不聞,食而不知其味」,但後來被假借成嗅覺的動詞(不過也有人認為這是錯用)。 (其中「轉注」「假借」兩項的意義,至今爭訟不休,尚無令人滿意的說法。)
總結以上古代六書,前兩項,「造字法」也;中兩項,「組字法」也;後兩項,「用字法」也。這六個原理,是古代文字學學者歸納出來的字學理論。其所含漢字構成法則,是長期演化而成的,不是任何一個人獨創的。
漢字有各種不同的書寫方式,即有不同的字體;不同的字體,漢字的字體形狀不一樣。就算是同樣的字體,也會因使用地區或使用者的不同而有字形上的差異。由於各地對字形的使用並沒有統一,加之大陸地區使用「新字形」(與「舊字形」或「傳承字形」相對)、日本使用「新字體」,便產生了許多差異。例如「刃」及「角」,在各地寫法都不盡相同。又如「口」字,中華民國官方規定最後一橫要寫得超過上面的橫折露出來一點,其他地區的寫法卻是不出頭的。
規整的字體(如:楷書、宋體、隸書、篆書等)書寫下的漢字是一種方塊字,每個字佔據同樣的空間。漢字包括獨體字和合體字,獨體字不能分割,如「文」、「中」等;合體字由基礎部件組合構成,佔了漢字的90%以上。合體字的常見組合方式有:上下結構,如:「笑」、「尖」;左右結構,如:「詞」、「科」;半包圍結構,如:「同」、「趨」;全包圍結構,如:「團」、「回」;複合結構,如:「贏」、「斑」等。漢字的基末級部件(或稱基礎部件)包括獨體字、偏旁部首和其他非字部件。
所謂的「文字」,古代是兩個東西,東漢許慎《說文解字》敘:「倉頡之初作書,蓋依類象形,故為之文,其後形聲相益,即謂之字。」;宋鄭樵《象類書》云:「獨體為文,合體為字」。這個文,現代的術語叫作字根部件,漢字是以意念的表達需要組合所需部件於一方塊,合成千千萬萬的字。
鄭樵的搜集,以形為主的文有三百三十個,稱為形母,以聲為主的文共有八百七十個,稱為聲母,合計一千二百文。
但鄭樵的聲母形母已經失傳,近代周何教授依據中文資訊交換碼第二集的22394字的字集重新整理的結果,得出漢字有869個聲母及265個形母,共計1134個。形母:鄭樵的搜集,有三百三十個。現代的研究整理,是265個。聲母:鄭樵的搜集,有八百七十個。現代的研究整理,是869個。
末級部件,再行拆解,即為漢字的最小構成單位:筆畫。漢字的筆畫離不開「點」、「橫」、「豎」、「撇」、「捺」、「折」這六種基本筆畫,另外還有「提」。以書法為例,對各種筆畫都有多種不同寫法,尤其以折的變化最多。
書寫漢字時,筆畫的走向和出現的先後次序,即「筆順」,是比較固定的。基本規則是,從上到下,從左到右,先橫後豎,先撇後捺,先外後內,先外後內再封口,先中間後兩邊。不同書寫體漢字的筆順可能有所差異。
以下舉出幾個各地字差異:
中國大陸 | 台灣 | 日本 | 南北韓 | 香港 |
---|---|---|---|---|
启啓 | 啟啓 | 啓 | 啓 | 啟 |
机機 | 機机 | 機 | 機 | 機 |
漢字是多種語言的共同書寫體系,每個字代表一個音節或數個音節(視語言而定)。此外念法上在日語以及各漢語中,讀音有「音讀」和「訓讀」之分。
除了日本以外,其他漢字使用地區仍有少數字使用多音節字,如「浬」(海里)、「嗧」(加侖)、「瓩」(千瓦)、吋(英寸)、哩(英里)等。中華民國官方機構或民間均普遍使用,在大陸地區由於官方廢除已不使用,但一般人也理解其意思。
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音,許慎的說文解字就採用這種注音方法,如「埻,射臬也,讀若准」。 直注法就是用另一個漢字來表明這個漢字的讀音,如「女為說己者容」中,使用「說者曰悅」來進行注音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以發揮注音的作用,例如「襪音韈」等。
魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以透過反切法進行標註,即用第一個字的聲母和第二個字的韻母和聲調合併來注音,使得所有漢字發音都有可能組合出來。如「練,朗甸切」,即「練」的發音是「朗」的聲母與「甸」的韻母及聲調所拼成。
近代以來,又發展出了仿漢字形式的注音符號及眾多拉丁化拼音方式。注音符號一直都是中華民國官方教學的一部分,學生在學習漢字前先要求必需掌握。而目前大陸最為廣泛使用的是漢語拼音。
由於漢字以本身表義為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方世界一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度,必須進行專門的漢語音韻學才能推測它們在上古漢語和中古漢語的發音。例如「龐」從「龍」而得聲,但今日北京話前者讀「páng・ㄆㄤˊ」,後者為「lóng・ㄌㄨㄥˊ」。
漢字是漢文組成的最小單位,大半可作單字詞獨立表義。隨著語言發展,也出現了不少兩字或多字詞語,近代白話尤多,大致可分為三類:
不過,準確掌握其複雜的形式和用法也成為了學習漢語的一種負擔。漢語中的常用詞彙約幾萬條,總詞彙量更有上百萬條,數量的龐大可能使人卻步。
在古文而言,使用單字比使用詞語來得精確且有效率,例如朱邦復先生就提倡精確使用「字」的復古作為。
漢字由於是開放集合,數量並沒有準確數字,日常所使用的漢字約為幾千字。漢字數量的首次統計,見於漢朝許慎之《說文解字》中,共收錄9353字。其後,南朝時顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另一部宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書。
近代編集的字典收字量更高,如清朝的《康熙字典》收字47035個;臺灣的《中文大字典》收字49905個;中國的《漢語大字典》(第一版)收字54678個,(第二版)收字60370個;最新的《中華字海》收字85568個,包含了《漢語大字典》、《中文大字典》、《康熙字典》和《說文解字》的所有收字;日本的《大漢和字典》收字48902個,另有附錄1062個。21世紀已出版的字數最多者,為日本《今昔文字鏡》,收字17萬個(含漢字以外的文字)。
20世紀所新創的,還有第一批簡化字後跟第二批的「二簡字」,其中也包括社會上不少人造文字,不過二簡字已被大陸官方廢除,只有少數字在社會上流行,但現時並沒有於計算機編碼中被收錄。
在漢字計算機編碼標準中,目前最大的漢字編碼是臺灣的國家標準CNS11643,目前(4.0)共收錄可考證之正簡、日、韓語漢字共76,067個,在戶政系統等官方機構普遍使用。臺灣及港澳地區民間通用的大五碼收錄正體漢字13053個。GB 18030是中華人民共和國現時最新的內碼字集,總共收錄70244個漢字;GBK收錄簡體、正體及日語、韓語漢字20912個,而早期的GB 2312收錄簡體漢字6763個。而Unicode的中日韓統一表意文字基本字集則收錄漢字20989個,另有七個擴充區、相容補充、筆畫和部首,總數亦高達94236個字。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。過去在漢字組成基本因子(前述字根部件)研究與教學上落後,造成學習上必須逐字學習難以舉一反三,漢字數量越多學習越困難,組建新字的風氣日趨保守,也沒有相應的資訊處理技術,於是有許多單一的漢語意義是以詞表示,例如常見的雙字詞,所以近代書寫的發展多朝向造新詞而非造新字。
年 | 字典名 | 漢字數 |
---|---|---|
100 | 説文解字 | 9,353 |
543 | 玉篇 | 12,158 |
601 | 切韻 | 16,917 |
997 | 龍龕手鑑 | 26,430 |
1011 | 廣韻 | 26,194 |
1039 | 集韻 | 53,525 |
1208 | 五音篇海 | 54,595 |
1615 | 字彙 | 33,179 |
1675 | 正字通 | 33,440 |
1716 | 康熙字典 | 47,035 |
1916 | 中華大字典 | 48,000 |
1989 | 漢語大字典(第一版) | 54,678 |
1994 | 中華字海 | 85,568 |
2001 | 異體字字典(正式一版) | 105,982 |
2010 | 漢語大字典(第二版) | 60,370 |
2014 | 漢字海 | 102,447 |
2024 | 異體字字典(正式七版) | 106,303 |
漢字字位(或者叫「字素」、「字種」)是指將同一個字的不同寫法(正體字、簡體字、二簡字、異體字、新字形、舊字形、訛字、缺筆字等)計算為同一個字,而不是分別計算為不同的字。例如:「够」和「夠」被視為同一個漢字的不同字位變體,而不是兩個漢字。
依據中華民國教育部《異體字字典(正式七版)》,漢字正字為29,920字,異體字為74,381字,另有待考附錄字2,002字,[30]但以上不含85字的和製漢字、255字的朝鮮漢字,[31]若加計則正字為30,260字。近代編纂的字典所收的字越來越多,實際上增加的絕大多數是字位變體而不是字位。例如,收字42,174個的《康熙字典》僅僅比收字85,568個的《中華字海》少1,000個左右的字位。[32]
國家語言文字工作委員會於1988年頒佈的《現代漢語常用字表》收錄3,500字(2,500個常用字,1,000個次常用字),適用於中國大陸。
2007年中國語言生活狀況報告裏,在10.07億漢字的語料上,進行漢字使用情況資料調查,結果為:595字數的覆蓋率達到80%,964字數的覆蓋率達到90%,2394字數的覆蓋率達到99%。[33]
山西大學計算機科學系受國家語言文字工作委員會委託,抽樣統計200萬字的材料,檢測《現代漢語常用字表》收字的使用頻率。結果是:2,500常用字覆蓋率達97.97%,1,000次常用字覆蓋率達98.49%,合計共3,500字覆蓋率達99.48%。
日本內閣於1946年頒佈《當用漢字》,收錄1,850漢字;文部省國語審議會(今文部科學省文化審議會)於1981年頒佈《常用漢字》,收錄1,945漢字,取代《當用漢字》。依《常用漢字》,1006個漢字在小學教授,939個在中學中教授,共計1,945個。2010年11月30日追加196個新的常用漢字,並削除5個漢字,合計共2,136字。
自1975年,日本漢字能力檢定協會推出日本漢字能力檢定,測試日本人對漢字的掌握。直至2007年,共2,716,711人考核。成績分為12級,由最高至最低排列分別為:1級、準1級、2級、準2級、3級、4級、5級、6級、7級、8級、9級、10級。
漢文教育用基礎漢字是韓國教育中規定的標準漢字,皆為與正體字大致相同的韓文漢字。於1972年8月16日公布,數量約1,800字,在中高等院校進行普及。
最簡單的漢字只有一筆畫,但卻不止一個字:除了「一」字以外,「乙」、「〇」、「丶」、「丨」、「亅」、「丿」、「乀」、「乁」、「𠄌」、「𠃋」、「𠃉」、「𠃊」、「乚」等都是漢字,而且都有各自的讀音。
中文漢字中,筆畫最多的漢字可能是「𰻞」,是一種麵食的名稱,此字至今習用,其不同寫法的筆畫數在54至71畫之間不等。被傳統辭典收錄的筆畫最多的漢字為《字彙補》、《漢語大字典》中由四個「龍」字組成的「𪚥」字,共64畫;同樣屬於64劃的字由四個「興」字組成的「𠔻」字,收入自《中文大辭典》;之後的是由四個「雷」字組成的「䨻」字,有52劃,收錄於《說文解字》。
另外,日本漢字「」收錄於日本的TRON計劃中,但此字無法提供有效證據表明其確有使用,因此狀況存疑。該字由3個「龍」字和3個「雲」個組合而成,共有84劃[34]。該字曾提交到當時的統一碼擴充C區,編號為JMK66147,後因擴充C區的時間原因被安排到了擴充D區,之後因找不到合適證據被復原[35]。最後提交到擴充G區並被接受。
現在,純漢字僅僅被用於記錄漢語。在日本,漢字和假名一起被用於記錄日語。在韓國,除了純漢字和純諺文記錄的朝鮮語,也有韓漢混用記錄的朝鮮語。
其他一些民族在早期會將漢字單純作為表音文字來記錄他們的語言。如蒙古語最早的文獻蒙古秘史即用純漢字當做表音文字進行記錄;日語最早的文獻也是把漢字當做表音文字來記錄日語,後來演變出萬葉假名;朝鮮語最早的文獻也是使用純漢字當做表音文字來記錄朝鮮語[36]。直到1443年,當時北韓王朝的世宗大王李祹發明了諺文,並在1446年頒布《訓民正音》,使得整個朝鮮半島從此開始使用諺文記錄韓語。
漢字是世界上最主要的基礎文字之一。在漢字的影響下,產生了許多文字。
契丹文、女真文、西夏文的創製受到了漢字的影響,它們跟漢字一樣都是方塊型文字,筆畫形狀也極其類似,其中契丹文、女真文也採用類似六書的造字法,西夏文則不採用六書造字法。但這些文字除個別字與漢字外形相同外,絕大部分字形都跟漢字不同,因此在Unicode中它們都是獨立區塊編碼的。
古壯字(方塊壯字)、古白字(方塊白字)、古布依字(方塊布依字)、字喃等文字可以說是漢字在其他語言中的擴充,因為它們很大一部分本身就是漢字(賦予新義),另一些則是用已有漢字偏旁組合構成新字,因此,這些文字的外觀上與漢字很相似,在Unicode中與漢字一道編入漢字區。
女書是用於記錄漢語的另一種文字,它們的造字法與六書有部分相似之處,但字的外觀與漢字差異較大,Unicode中作為獨立區塊編碼。
以上文字有些因各種原因而消亡,如今除專家學者外無幾人能識。
日語的假名(仮名)是由漢字的草體、簡筆演變而成的。朝鮮半島使用的諺文在創製時深受漢字影響[37]。諺文和日語假名一樣可以和漢字一同混寫。
此外如蒙古文、滿文、錫伯文等也是在漢字書寫方式和書寫工具的影響下,將從右向左書寫的源自察合台文的書寫方式改為從上到下書寫,文字的結構也隨之有所變化。
漢字是承載文化的重要工具,目前留有大量用漢字書寫的典籍。不同的方言、甚至語言都使用漢字作為共同書寫體系。在古代日本、朝鮮半島、越南、琉球群島,以及位於婆羅洲的蘭芳共和國,漢字都曾是該國正式文書的唯一系統,因而漢字在歷史上對文明的傳播分享有著重要作用。
由於漢字和發聲的聯繫不是非常密切,比較容易被其他民族所借用,如日本、朝鮮半島和越南都曾經有過不會說漢語,單純用漢字書寫的歷史階段。漢字的這個特點對於維繫一個文化圈—一個充滿各種互相不能交流的方言群體的民族——發揮了主要的作用。
漢字對周邊國家的文化產生過巨大的影響,形成了一個共同使用漢字的漢字文化圈,在日本、越南和朝鮮半島、琉球群島,漢字被融合成它們語言的文字「漢字(かんじ)」、「漢字(한자)」、「漢字(hán tự)」。直到現在,日語中仍然把漢字認為是書寫體系的一部分。在朝鮮民主主義人民共和國和越南,已經完全不再使用漢字;在大韓民國,漢字的使用在近幾十年來越來越少;但是由於朝鮮語/韓語中使用了大量的漢字詞彙,並且重音現象嚴重,所以在需要嚴謹表達的場合(如法律條文)時仍然會使用漢字。雖然在通常情況下人名、公司機構名稱等均使用韓文書寫,不過大多數的人名、公司機構均有其對應的漢字名稱。
漢字於公元3世紀經朝鮮半島輾轉傳入日本。二戰後日本開始限制漢字的數量和使用,頒布了《當用漢字表》及《人名用字表》等,其中簡化了部分漢字(日本新字體),不過文學創作使用的漢字,並不在限制之列。日本除從中文中傳入的漢字外,還創造和簡化了一些漢字,如「辻」(十字路口)、「栃」、「峠」(山道)和「広」(廣)、「転」(轉)、「働」(勞動)等。
公元3世紀左右,漢字傳入了朝鮮半島,朝鮮語/韓語曾經完全使用漢字來書寫。相傳薛聰在當時發明了吏讀,把朝鮮語用同音或同義的漢字來表示。例如:「乙」字被用來表示韓語中的後綴「-l(ᆯ)」。由於有不少發音都沒有對應的漢字,所以朝鮮半島的人民又運用組字法,把兩個或多個漢字合組成為一個新的吏讀字。相傳後來的契丹文就是受到吏讀字的影響。此外尚有鄉札、口訣等以漢字表記朝鮮語的方法。
1443年,朝鮮世宗大王頒布《訓民正音》,發明了諺文與漢字一起使用,但當中有不少部件仍然有昔日吏讀字的痕跡。現在的大韓民國雖禁止在正式場合下使用漢字,並停止了在中小學中教授漢字(但是從2011年開始,大韓民國的李明博政府已經決定將漢字重新納入中小學的課程裡),不過漢字在民間仍在繼續使用,且可以按照個人習慣書寫,但是現在能寫一筆漂亮漢字的韓國人越來越少。朝鮮民主主義人民共和國於1948年廢除了漢字,僅保留了十幾個漢字(參見廢除漢字)。
公元1世紀漢字便傳入了越南,越南語也曾完全使用漢字做為書寫用文字,並在漢字的基礎上創造了喃字,但是由於書寫不便,漢字仍是主要的書寫方式。
漢人許多日常生活、民俗文化都與漢字有關,例如:
漢字獨特優美的結構,書寫的主要工具——毛筆有多樣的表現力,因而產生了中文獨特的造型藝術——書法。而篆刻是和書法相關的藝術,用刀在石材上雕刻出篆字作為印章,尚有勒石、山壁題字等。
漢字歷史上是不斷在組新字的,目前的各種漢字並非同時定型於某一年代,而是應時代需要逐漸發展而來的。例如:「人」字在商朝就已出現,「凹」字和「凸」字則是在唐朝才出現的。
自十九世紀中葉後,亞洲和西方都發佈了很多漢字拉丁化方案,如:
現在,漢語拼音方案是使用最廣且被國際上廣泛接受的漢字拉丁化方案,同時也是被聯合國接受的漢字拉丁化方案。而威妥瑪拼音歷史悠久,至今仍用於中華民國(臺灣)的人名、地名拼寫。不過隨著漢語拼音在國際上的普及,現在使用頻率正在大幅度的減少。2008年9月16日,中華民國行政院跨部會議通過提案,放棄此前使用通用拼音的政策,改採漢語拼音為譯音標準,並從2009年1月1日起實施[39][40][41],但舊護照姓名和部分地名、道路名稱仍採用威妥瑪拼音、郵政式拼音、國語羅馬字、國音二式抑或通用拼音[42]。
漢字中存在許多異體字,它們的意義和讀音完全相同,只是寫法不同。異體字的產生部分是由於歷史原因,有的則是人為造字,如「和、咊、龢」、「秋、秌、龝、𥤛」等。
臺灣也有使用所謂的異體字,例如「臺」與「台」、「體」與「体」以及「學」與「学」等等。
中國大陸於1956年公布整理異體字表,廢除了大量異體字,但後來因為各種原因恢復了部分異體字。如「於」曾被當作「于」的異體字廢除掉,但因爲姓氏中「于」和「於」同時存在,不宜混為一談,所以在1988年發表的《現代漢語通用字表》中又恢復成為規範字。另外,不同地區對異體字的取捨有所不同,例如韓國就以漢字各種異體字中最早出現的樣式為標準寫法。所以,在韓語漢字的標準中,取「甛」而不取「甜」、取「幇」而不取「幫」、取「畵」而不取「畫」。
由於英文文字是由26個字母排列組合而成的文字,因此可以簡化輸入步驟;相比較之下漢字則不能如此,從字形上漢字雖然可以拆解成不同的部分,但是被分成的部首或偏旁數量過多,這樣不但不能達到簡化輸入的目的,反而顯得更為繁瑣。於是從漢字字音上去考慮,漢字輸入被分成少量的語音元素組合排列,反而可以達到簡化輸入的步驟。因為是語音輸入對漢字的讀音必須清楚,某些生僻字或不知道漢字發音的則會很困難,這在一定程度上限制了漢字的輸入。
由於打字機鍵盤是為歐美文字設計的,在設計時本身沒有考慮漢字輸入的問題,輸入漢字往往比輸入拼音文字困難。漢字沒有經過中文打字機的普及,直接進入了電腦中文資訊處理階段。在電腦發明初期曾引起漢字能否適應電腦時代的問題,支援漢字拉丁化的學者甚至以此為理據。
隨著各種中文輸入法的出現,漢字的電腦輸入、儲存、輸出技術得到了基本解決,大大提高了中文寫作、出版、資訊檢索等的效率。目前中文輸入法有上千種之多,主要包括表音輸入和表形輸入兩類,也有兩者兼之的。漢字的語音輸入、手寫辨識和光學字元辨識(OCR)技術也已得到廣泛應用。
如收錄數千字的GB 2312(中國大陸)、大五碼及中文標準交換碼(臺灣)、HKSCS(香港)、JIS(日本)、KS X 1001(韓國)、KPS 9566(朝鮮),以及收錄兩萬多字的GBK(中國大陸)、國際標準統一碼、通用字元集等等。在這個過程中,因為技術及其他種種因素,在收錄字數,及收錄字體等方面或做不同層次的調整。
中國政府為了解決郵政戶籍整理等的用字需要,於2000年實行了一個新的漢字編碼的國家標準《漢字編碼字元集-基本集的擴充》GB 18030-2000,共收漢字27484個。後又發布了GB 18030-2005再次進行擴充,添加了42760個漢字。
為進行資訊交換,各漢字使用地區都制訂了一系列漢字字元集標準。
隨著計算機技術的不斷發展,漢字的輸入方式越來越多樣化、速度越來越快,並且這項技術仍在不斷提高。
漢字詞彙更新的實例
在化學領域,尤其需要大量描繪微世界的新詞,因此化學學科漢字更新的情況最爲顯著。 化學名詞曾用了「形聲、會意造字法」,造了一系列的新字,很多是將兩個字的字根組合,以表示新的意義的字,其發音也是原來兩字發音之組合(反切法)。例如:
除了中國使用的簡化字外,日本與韓國也分別對漢字進行了簡化。在臺灣,官方用字或正式文書必須使用正體字;在手寫的非正式文書中,有些人會使用行書、草書或民間的俗寫,例如:「台」(臺)、「门」(門)、「与」(與);但是,不會使用簡化字中較難辨識字意的合併字,例如:「里」(裡、裏)、「后」(後)、「余」(餘)、「制」(製)、「面」(麵、麪)、「谷」(穀)、「复」(復、複)、「台」(臺、檯、颱),皆不簡化。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.