Loading AI tools
溝通的方式 来自维基百科,自由的百科全书
語言(英語:language,詞源為拉丁語:lingua,意為「舌」)[1]是一類複合交流系統,主要包含其形成、習得、維護及應用,特別是相應的人類能力。某一門語言則是這類系統的具體例子。除了交流溝通外,語言也是一個人的身分認同中主要的構成部分,也是一個文化的主要成分之一。
語言學是對語言的科學研究。語言哲學方面相關的辯論,比如詞彙能否能表述經歷,至少可追溯至古希臘的高爾吉亞與柏拉圖。以盧梭為代表的一些思想家認為語言源自情緒,而康德認為其源於理性和邏輯的思辨。諸如維根斯坦等20世紀的哲學家論證說哲學實質上就是對語言的研究。著名的語言學家有弗迪南·德·索緒爾、諾姆·喬姆斯基等。
人類語言據估算約有5000到7000種,由於語言與方言的差別難以定義,難以有準確的統計。自然語言常以口述或手語方式表達,但任何語言都可以用聲音(如口哨語言)、視覺(如手語)或是觸覺剌激(如盲文)來表現。符號學中將這一現象描述為模態無關(modality-independent)。依照語言哲學對語言與意義的定義,廣義上,「語言」可以指代學習並使用該複雜交流系統的認知能力,也可以描述構成這一系統的規則集合,還可以指由語言規則生成(produce)的詞句的集合。所有的語言都依靠符號過程來將特定的記號和意義相連結。口語、手語及觸覺語言都有音位學系統來將符號組合成詞或是語素的系統,也有語法學系統來將詞及語素組合成短語和話語。
人類語言具有創造性和移位性,完全靠社會習俗及學習而來。語言的複雜結構使得其可表達的範圍比任何已知的動物交流系統都要廣。依心理學的觀點,語言是起源於人族有了形成心智理論的能力,以及有分享的意向,之後漸漸由其原始的溝通系統演變而來[2][3]。這個發展出現的時期也和人類腦容量擴展的時期大致相同,許多語言學家認為語言的結構有因為一些特定的溝通及社會機能而演變。人腦有許多部份會處理語言,但主要是在布若卡氏區及韋尼克區。人類的語言習得是在童年早期的社會互動中學習的,小孩大約三歲就可以流利的說話了。語言的使用已深深紮根於人類文化之中。因此語言除了用在溝通上,也有許多社會及文化上的用途,例如強化群體身份認同及社會階層,也用來社交梳理及娛樂。
語言會隨時間演進與分化。其演化歷史可以通過與現代語言的比較來構擬:從現代語言中確定哪些特質是祖語存在的,由此在語言的後續發展階段得以存續。有共同祖語的一組語言稱為語系。印歐語系的語言在今天為使用人數之最,其主要成員有英語、俄語和印地語。漢藏語系包括漢語諸方言[註 1]、藏語、博多語等。亞非語系包括阿拉伯語、索馬利亞語及希伯來語。班圖語支中有斯瓦希里語、祖魯語和其他數百種非洲語言。南島語系包括印尼語、馬來語、他加祿語及數百種遍布太平洋的語言。達羅毗荼語系主要分布於印度南部,其中有泰米爾語和泰盧固語。學術界認為現存口語中有50%至90%會在2100年前滅絕[4]。
當今「語言」一詞是英語「language」或者法語「langage」的翻譯,它可能源於原始印歐語的 *dn̥ǵʰwéh₂s(舌頭、說話、語言)、拉丁語的「lingua」(舌頭、語言)或古法語的「language」[5]。有時「語言」也指代碼、密碼或者是其他人工創造的交流系統,如程式語言或者是人工語言。在這個意義上,形式語言和先天的人類語言不同,它是一個用於編碼和解碼信息的記號系統。本條目主要關注語言學所研究的自然語言。
在漢語中,一人自說叫言,兩人相應答叫語。《詩經·大雅》疏「於時言言,於時語語」云:「直言曰言,謂一人自言;答難曰語,謂二人相對。」[6]鄭注大司樂曰:「發端曰言,答述曰語。」[7]
而作為語言學研究的對象,「語言」有兩個初始含義:一種抽象概念,一種特定的語言系統,比如指法語。瑞士語言學家弗迪南·德·索緒爾定義了現代語言學的基本原則,他最先區分開了言語(parole)和語言(langue)兩個概念。「語言」這一概念指的是某個特定的語言系統實例,而「言語」則指在特定語言裡具體的言語運用。[8]
而就一個籠統概念而言,語言的定義可以用來強調語言現象的各個方面[9],形成相左、甚至互斥的各個語言學派別。[10]語言哲學中的關鍵問題,例如語言的起源和本質,其爭論可追溯至古希臘。哲學家高爾吉亞與柏拉圖曾就詞語、概念與現實三者的關係作過辯論。高爾吉亞認為語言無法表達客觀經驗和主觀體驗,於是乎語言交流和真實也就不可能存在;而柏拉圖則堅持意志和概念先於語言存在,故語言交流是存在的。[11]
啟蒙時代關注人類起源,連帶關於語言起源的問題也變得引人注目。盧梭、赫爾德等思想家認為語言來源於情緒的本能表達,故語言較之邏輯表達和理性思考,與音樂和詩歌等感性認知的關係更緊密一些。而康德、笛卡爾等理性主義哲學家則相反,認為語言源於理性和邏輯思辨。20世紀以來,思想家開始疑問語言是單純反映了客觀世界的構造,還是創造某些概念將人類自己的主觀體驗強加到了對世界的認識中去,語言在此到底扮演了什麼角色。這個問題深究下去,就變成了哲學的實質是否語言的研究。故20世紀的哲學發展中,語言在概念的創造和循環上起了重要作用的觀點又重新出現,路德維希·維根斯坦等哲學家以及語言轉向便是其代表。直到今天,關於語言的意義與關聯、認知與意識的爭論依然活躍。[12]
一種定義將語言主要解釋為讓人們從事語言行為(學習,表達並理解語言)的心智。這種定義側重於語言對於人類的通用性,並強調人類語言能力的生物學基礎是人腦的一種獨特的演化。「人類與生俱來地具有獲得語言的動力」這一觀念的支持者提出,所有認知能力正常的孩子,只要成長環境裡能接觸到語言,就能在沒有正式教學的情況下習得語言,這一事實正好支持了這個觀念。語言甚至可以在不使用同一種語言的人們聚居或共同成長的環境中自發產生;例如克里奧爾語,以及自發產生的手語如尼加拉瓜手語。 這個可以追溯到哲學家康德和笛卡爾的觀點認為語言是與生俱來的的,比如諾姆·喬姆斯基的普遍文法理論,或者美國哲學家傑瑞·福多的極端先天理論。這些定義經常被使用於語言在認知科學以及神經語言學領域的研究中。[13][14]
另一項定義將語言視作由組合語法規則制約、旨在傳達語義的記號形式系統。這項定義強調了人類語言可被描述為封閉的結構系統,該系統還包括了特定記號與特定意義的關聯規則[15]。這種語言的結構主義觀點最初由費爾迪南·德·索緒爾提出[16],他的結構主義為諸多語言學方法奠定了基礎[17]。
一些索緒爾語言學觀點的支持者主張採用形式方法來研究語言結構,即通過辨別語言結構的基本元素,並正式表述這些元素結合成詞、成句的規則。這一理論的主要支持者是生成文法的提出者諾姆·喬姆斯基。他將語言定義為可用轉換語法生成的句法[18],認為這些規則是人類思維的固有特徵和構成語言的基本原理[19]。通過對照,這樣的轉換語法也被廣泛用於提供數理邏輯、形式文法理論語言學和計算語言學[20][21]中語言的定義。在這種語言學中,阿爾弗雷德·塔斯基、伯特蘭·羅素和其他數理邏輯學家對這種語言學繼續發展,認為語義存在於命題和現實之間的邏輯關係中。
另一種定義則將語言看作一種口頭或符號上的人類交流系統。這種定義強調語言的社會功能,著眼於人類使用語言去表達自己或者是控制周圍環境中的客體。語法功能論用語言的交流功能解釋語言,理解語言的語法結構能夠令語法有一個過程去適應並滿足語言使用者的交流需求。[22][23]
這種語言觀點還涉及到語用學、認知語言學和互動框架,還有社會語言學和語言人類學。作為一種功能主義理論,它傾向於把語言作為動態現象、永遠在語言運用當中變化的結構來研究。語言類型學的研究,特別是對於語言結構特徵的分類也受到這種觀點的重視,因為語言類型往往會部分地影響到語法化進程的軌跡。[21]在語言哲學中,作為語言和意義的中心,語用觀點被拿來與後來路德維希·維根斯坦和約翰·奧斯丁、保羅·格萊斯、約翰·羅傑斯·希爾勒和威拉德·馮·奧曼·蒯因等其他一般的語言學家所做的工作相提並論。[24]
相比於其他形式的交流系統,例如人類以外的動物所使用的動物語言,人類語言是獨特的。其他動物,比如蜂和猿所使用的交流系統都是封閉系統,其可表達的思想往往非常有限[25]。而人類語言則相反,沒有上限且富有創造性,允許人類從有限元素中產生大量話語,並創造新的詞語和句子。這是因為人類語言是一種對偶碼,語言當中有限數量的元素本身並沒有意義(如聲音、文字和手勢),但意義的組合(包括詞語和句子)是無限量的,有限的元素和無限的意義相結合即可產生無限的人類語言[26]。
然而,有研究指出澳大利亞的栗冠彎嘴鶥能夠將相同的聲音元素以不同方式編排,來產生兩種功能迥異的發音[27]。此外,斑鶇鶥也顯露出利用兩種相同類型的聲音作類似行為的能力,這兩種類型的聲音只能靠聲音元素重複的次數去辨別[28]。的確,一些物種確實能夠通過社會學習來獲得一些交流形式。比如,一隻名叫坎茲的倭黑猩猩學會了用一套耶基斯語手語來表達自己的意願;很多鳥類和鯨類也通過模仿同類學會歌唱。然而,雖然這些動物可以掌握大量的詞語和符號[註 2],但它們能學會的記號數量最多只相當於平均4歲的人類兒童,也沒有掌握任何類似人類語言裡面語法一樣的規則[30]。
人類語言異於動物的交流系統,還在於人類語言存在語法範疇,如名詞和動詞、現在和過去等,用來表達極其複雜的意義[30]。人類語言還擁有獨特的遞歸層級屬性,例如,一個名詞短語裡面能夠包含另一個名詞短語(如「[[猩猩]的嘴唇]」),有一個從句裡面也能包含另外一個從句(如「[我看见[狗在跑]]」)[3]。人類語言也是唯一一種模態無關的自然交流系統,其適應性令它可以應用於各種媒介。如口語使用聽覺情態,而手語使用視覺情態,盲文使用觸覺情態[31]。
人類語言的獨特性,也體現在能夠使用抽象概念;擁有移位性,允許人類語言描述一些假想的、在過去或未來而非當下發生的事情。有些動物的交流系統也有移位性(例如,蜂可以傳遞自己探測範圍以外的位置信息),但遠遠達不到人類的水平[26]。
對語言定義的假設有別,導致對語言起源的理論有異。有觀點認為,語言十分複雜,很難想像它會無中生有並一下子進化到終極形態,因此語言一定是從人類祖先早期的前語言系統(pre-linguistic systems)演化而來。基於這一觀點的理論被稱為延續性發展理論(continuity-based theories)。相反觀點認為,語言是人類獨有的特質,不能將它與非人類的任何事物相比較,因而語言一定是在史前人類(pre-hominids)向早期人類(early man)轉變的過程中突然出現的。類似地,基於喬姆斯基生成文法的理論,大多將語言視作編碼在基因中的內在稟賦;而功能主義理論則將其視作與文化高度相關、通過社交習得的系統。[33]
語言學家、哲學家諾姆·喬姆斯基是非連續性(Discontinuity)人類語言起源理論的重要支持者。[33]他解釋:「或許很久以前某些靈長類動物在到處閒逛,突然間,可能是受到某些奇異的宇宙輻射過後,產生了一些隨機突變,它重組了靈長類的大腦,在裡面植入了一個語言器官。」[34]雖然這番描述有些文學化,他仍堅持「和包括語言在內的其他跟演化有關的神話故事相比,這可能更接近於事實」。[34]
大多數學者則更傾向於連續性假說,但對於演變的過程他們各自有著不同的看法。有一些把語言能力看作很大程度上是天生的,其中包括史迪芬·平克在內,他們避免去研究靈長類中明確的語言雛型,而單純認為那只是動物認知的先例[14],「語言本能」是通過通常的方式漸進演化而來[14]。另外有一些學者如麥可·托馬塞洛,則認為語言是一種交流工具,它可以通過認知控制的社會交流方式中發展而來,這些方式更多地是基於手勢而非發聲的。[35]還有一些連續性假說的觀點認為語言發源於音樂和歌唱,這種觀點受到了盧梭、赫爾德、洪堡和達爾文[36][37][38][39][40][41],以及其最主要的支持者、考古學家史蒂芬·米森的支持[42]。語言學家史蒂芬·安德森推測口語已經存在了6萬至10萬年[43]。他說:
“ | 語言進化起源的研究者們大體上認為語言皆源自一處,於是乎所有現代口語之間都存在某些親緣關係,即使這些關係如今已不可考……因為重構的可行方法有限。[44] | ” |
由於語言的起源處於人類史前時代的早期,當時並沒有任何形式的書面記載,因而其發展過程未能留下直接的歷史遺蹟,同時如今也沒有發現可與之相比較的發展過程。儘管如此,現代新誕生的一些手語(如尼加拉瓜手語)可能可以讓我們看到語言發展中必定出現的階段與過程。[45]另一種研究方法是通過觀察早期人類化石,以圖找到適應語言使用的生理結構變化的蹤跡。[46][47]這些蹤跡顯示,腦的大小關係到體型,而喉嚨的出現提高了發聲,以及使用工具和其他製造物品的能力。[48]而對一些已滅絕人類的DNA的檢測中,能否找到與語言功能有關的基因(如FOXP2)或許也能為我們提供許多信息。[49]還有一種考古學方法,是去尋找象徵行為(如重複的儀式活動)所留下的考古學遺蹟,比如用作人體彩繪的顏料,同時從理論上論證由象徵行為到語言的邏輯關係。[50][51][52]
語言的演化與其所需的解剖學上的先決條件,理論上其時間跨度從人屬(230至240萬年前)自黑猩猩屬(500至600萬年前)分化出來一直到行為現代性(behavioral modernity)的完全出現為止(約5至15萬年前)。一般都認同南猿與類人猿的交流方式並無顯著區別[53],但也有對於始祖地猿的研究提出了異議[54]。而對於人屬約250萬年前出現後的發展,學者間有著不同的意見。有一些認為能人(約230萬年前)就已經有了原始的類語言系統,另一些則認為到直立人(180萬年前)或海德堡人(60萬年前)時才有原始符號交流,而到10萬年前具有行為現代性的智人出現之時語言才開始發展。[55]
2000多年前,隨著婆羅米文的發展,印度出現了第一份對於個別語言的語法描述,它被認為是世界上最早的語言學研究。如今,現代語言學已經發展成為了一門科學,基於前述的各種語言學理論觀點審視語言及語言學的所有方面。[56]
語言學研究從不同的理論角度和研究思路可以分為許多不同的專業分支領域。例如,描寫語言學考察個別語言的語法;理論語言學基於現存不同的人類語言數據建立如何概念化並定義語言本質的理論;社會語言學研究語言的社會運用,從社會的角度描述語法,探尋語言的社會功能;神經語言學測試並研究人類大腦神經對於語言的理解、產出和習得;計算語言學基於描寫語言學和理論語言學,構建語言的計算機模型來處理自然語言,測試語言學假說;而歷史語言學利用詞彙和語法描述追溯個別語言的歷史,並常利用比較語言學的研究方法重構語言譜系。[57]
一般認為,正式意義上的語言學最初始於公元前5世紀印度文法家波你尼對於梵語詞法規則的1959條歸納。[58][59][60]而蘇美爾人也早在公元前1900年左右就研究了蘇美爾語和阿卡德語之間的區別。隨後,所有擁有書寫系統的文明都產生了自己的文法傳統。[61]
17世紀,法國普遍唯理語法提出,任何語言的語法都反映了思想的普遍基礎,故語法本身也具有普遍性。18世紀,英國語文學家、古印度專家威廉·瓊斯首次使用了對照的方法來研究語言,開創了比較語言學[62],而威廉·馮·洪堡則將語言的科學研究從印歐語言拓寬到所有語言。20世紀早期的弗迪南·德·索緒爾是最重要的形式主義語言學家之一,他對比分析了語言及其各個要素,認為語言是一種內部要素相互關聯的靜態系統[16],又對比了語言學研究的幾個基本研究角度,如歷史語言學與共時語言學,語言與言語,奠定了現代語言學的基本研究原則。[63][64]
1960年代,諾姆·喬姆斯基提出生成文法理論。該理論認為語言最基本的形式是一套全人類共有的語法規則。這套規則叫做普遍文法,它是所有人類語言語法的基礎。喬姆斯基認為語言學的基本任務就是描述普遍文法,而個別語言的語法研究對語言學的重要意義在於能夠從中推導出是怎樣的底層普遍規則產生了該語言能被觀察到的語法特點。[65]
與生成學派的正規文法理論不同,功能主義認為既然語言是一個工具,根據它的功能就可以最徹底地分析其結構。形式文法尋求定義語言當中不同的系統要素,描寫要素的相互關係、正規文法規律和文法操作,而功能主義理論則尋求定義語言功能,並將具現它的語言要素跟它聯繫起來。[21][註 3]
所有文化當中,口語都是語言的默認形式。口語的產生依賴於控制嘴唇,舌頭和聲樂裝置的其他部件的複雜能力,聲學解碼言語語音的能力,以及獲取和產生語言所需的神經裝置。[68]對人類語言遺傳基礎的研究處於早期階段:唯一一個與語言生成有關的唯一基因是FOXP2,如果受突變影響,可能會導致一種先天性語言障礙。[69]
大腦是所有語言活動的協調中心:它控制著語言認知和意義的產生以及言語的產生機制。儘管現代採用了成像技術,腦科學研究已經取得了相當大的進步,但我們對語言神經學基礎的了解非常有限。神經語言學致力於研究與語言相關的神經系統。[70]
神經語言學最初的工作是腦部病變患者的語言研究,以了解特定區域的病變如何影響語言和言語。通過這些研究,19世紀的神經科學家發現大腦中的兩個區域與語言處理密切相關。一個是韋尼克區,位於勢半大腦半球(通常為利手的反側[71])的顳上回的後部。在這個大腦區域有病變的人會出現感覺性失語症,其語言理解會受到嚴重損害,但言語保留了自然的節奏和相對正常的句子結構。第二個區域是布若卡區,位於優勢半球的額葉。該區域患有病變的人會出現表達性失語症,這意味著他們知道自己想說什麼,但就是無法正常地說出來。[72]表達性失語症患者還可能有流利性、清晰度、詞彙發現、單詞重複上的問題,也很難在口頭和書面形成或理解語法複雜的句子。患有這種失語症的人也很難說出合乎語法的言語,並且無法利用句法信息來確定句子的含義。表現性和接受性失語也會影響手語的使用,與它對語言的影響類似,表現性失語症患者只能慢慢打出語法不正確的手語,而接受性失語症患者則可以流利地使用手語,但是他們的手語別人難以理解,他們也很難理解別人的手語。這表明腦部損傷損害的是使用語言的特定能力,而非語音生成的生理能力。[73][74]
20世紀後期,隨著技術進步,神經語言學家還採用了非侵入性技術,如功能磁共振成像(fMRI)和電生理學,來研究無損傷個體的語言處理。[70]
口語依賴於人體產生聲音,即產生以可振動鼓膜的頻率在空氣中傳播的縱波的能力,這種能力取決於人類語言器官的生理學。這些器官包括肺部喉部和上部聲道(喉嚨、嘴巴和鼻子)。通過控制不同的發音部位,可以操縱氣流以產生不同的語音。[75]
語音可分為音段成分和超音段成分。音段按順序前後排列,通常由不同字母表示,例如羅馬字母。在自由流暢的言語中,一個音段與下一個音段之間沒有明確的界限,在單詞之間通常也沒有任何明顯可聽見的暫停,故音段的區別在於發音時不同的調音方法,例如元音和輔音的區別。超音段成分包括諸如輕重讀、發聲類型、音色、音韻或語調等要素,所有這些超音段成分都可能影響多個音段。[76]
輔音和元音音段組合形成音節,而音節又組合形成話語;這些語音學上可以由兩次吸氣相之間的空隙來區分。在聲學上,這些不同的音段的特徵在於不同的共振峰結構,可見於時頻譜中(見右圖)。共振峰是特定聲音的頻譜中的振幅峰值。[76][77]
元音指氣流在沒有調音的情況下不受阻礙地通過口腔而發出的音。它們的音值根據嘴唇張開的程度和舌頭在口腔內的位置而有所不同。[76]當嘴唇相對閉合時發出的元音為閉元音,如元音 [i](漢語「依」的韻母),而當嘴唇相對開放時發出的元音則為開元音,如元音 [a](漢語「啊」)。如果舌頭往後,則音值會變為 [u](漢語「烏」的韻母)等元音。音值也會隨嘴唇形狀發生變化,例如 [i](不圓唇前元音)圓唇則變為 [y](圓唇前元音,如德語「ü」或粵語「於」)。[78]
輔音指氣流在調音(上部聲道的某些部分變窄或阻塞)是出現摩擦或閉合而發出的音。輔音音值因調音部位即聲道中阻塞氣流的位置而異,這些位置通常在嘴唇、牙齒、牙槽嵴、硬齶、軟顎、懸雍垂或聲門。每個調音位置產生一組不同的輔音,依調音方法或阻塞類型還能細分,一種是完全阻塞的閉合音或塞音,另一種是不完全阻塞的擦音或近音。根據發聲時聲帶有無振動,輔音也可分清濁音,如英語中 bus 的 [s] 為清音(噝音)而 buzz 的 [z] 為濁音(濁齒齦擦音)。[79]
一些音素,包括元音和輔音,都能利用鼻腔調音,這些音被稱為鼻音或鼻音化語音。其他音則取決於舌頭在聲道中與氣流的相對位置,例如 [l](稱為邊音,因為空氣沿著舌頭的兩側流動)和 [ɹ](稱為齒齦近音)。[77]
通過調用發聲器官和調音部位,人類可以產生數百種不同的聲音:有些聲音在世界各種語言中都非常常見,而有些罕見音素則只見於某些語系、語族,某些語言區域甚至單一語言。[80]
一般把語言看作是一種由三部分組成的符號交流系統:記號,意義和連接兩者的符碼。符號學負責研究符號過程,記號和意義如何組合,以及記號的使用和解釋。記號可以由聲音,手勢,字母或符號組成,具體取決於語言是去說、去做手語還是去寫,並且它們可以組合成複雜的記號,例如單詞和短語。當用於交流時,記號由發送者編碼並通過信道發送給接收者,後者對其進行解碼。[81]
一些定義將人類語言與其他的交流系統區別開來:語言記號具有的恣意性,故語言記號與其意義之間沒有必然的聯繫;語言系統具有二元性,故語言具有分層嵌套結構,如聲音組成詞,而詞組成短語;語言語言要素具有離散性,故構建語言記號的要素都是離散單元,如聲音和單詞可以相互區分,並以不同的模式重新排列;語言系統具有能產性,故有限的語言要素理論上可以組合成無限多的組合。[81]
將記號組合成單詞和短語的規則稱為句法或語法,而與獨立的記號、音素、詞、短語和文本相聯繫的意義則稱為語義。[82]索緒爾的語言學研究當中最早將語言劃分為獨立但又相互聯繫的記號和意義系統,現在這一觀點幾乎被所有語言學分支採納[83]
人們通過將一個記號聯繫到一種意義來進行語言表達。這些語言記號必須能為人所感知,例如聲音、圖像或是手勢,它們根據人們的習慣被聯繫到一個個具體的意義。由於它們的最基礎的意義來源於人們交流中的約定。語言符號的約定是建立在社會和歷史上的,而非是具體的某種符號生來便具有與它的意義間的關係。以這種觀點看來,語言符號可以認為是任定的。
因此,語言必須擁有與特定意義相關聯的詞彙。例如,英語單詞「dog」表示灰狼種下的犬亞種(Canis familiaris)。在一門語言中,與意義相關聯的任意一組符號的集合被稱作詞彙,與意義相關聯的單一符號稱為詞位。語言中並非所有的意義都以單詞表示,很多情況下,意義會以語法範疇的形式嵌入到語言的詞法(morphology)與句法(syntax)中去。[84]
所有語言都包含表達屬性、狀態或行為的謂語語義結構。語義學一般被視作關於說話者如何將真值分配給陳述的研究,故意義也被視作判斷謂語關於某個實體為真或假的一種過程。例如,「[x [是 y]]」或者「[x [做 y]]」。最近,這種語義模型得到了更多動態意義模型的補充,這些模型結合了一些共享知識,這些知識說明了意義生成過程中記號是如何被解釋為語言的。這種意義模型在語用學領域得到了探索。[84]
根據形式,語言結構可以基於聲音(語言),手勢(手語),圖形或觸覺符號(文字)系統。音位學對語言使用聲音和符號表達意義的方式進行了研究。[85]研究人類如何發音及感知聲音的學科稱為語音學。[86]在口語中,意義產生於聲音作為一個系統的一部分時,一些聲音有助於表達意義,而其它的卻沒有。在任何給定的語言中,只有有限數目的許多不同的聲音可以由人類的發音器發出有助於構建意義。[80]
作為語言系統的一部分的聲音被稱作音素。[87]音素是聲音的抽象單位,定義為語言中最小的可以區分一對差異最小的詞(所謂的最小對立體)的意義的單位。在英語中,舉個例子,單詞bat [bæt]和pat [pʰæt]形成一個最小對立體,在此之中/b/和/p/ 區別了這兩個具有不同意義的詞。但是,每種語言都有不同的區別聲音的方式。例如說,在一種不區分清音與濁音的語言中,音位[p]和[b](如果它們都存在)可以被認為是一個音素,因此這兩種發音具有同種意思。類似的,英語並不區分輔音送氣與不送氣發音的區別,但許多其他語言卻區分開(如韓語和印地語):在單詞spin [spɪn]中的不送氣音/p/和單詞pin [pʰɪn]中的送氣音/p/被認為僅僅是相同音素的不同發音方式(單個音素的這種變化稱為同位異音),而在官話中,同樣的發音差異區別詞「趴」[pʰá] 和「八」[pá](á上面的變音符號表示高音調)。[88]
所有的口頭語言都至少擁有兩種音素:元音和輔音,可以結合構成音節。[76]在擁有音素如輔音和元音的同時,一些語言也使用聲音的其他形式去傳達意義。許多語言使用例如輕重重音、高低重音、元音長度以及聲調的方式去區別意義。由於這些語音現象運作於單個音段水平之外,它們被稱為超音段成分。[89]一些語言只有幾個音素,例如羅托卡特語和皮拉罕語分別只有11和10個音位,而另外一些語言像宏語也許會擁有像141個這樣多的音素。[88]在手語中,音素的替代(曾稱為手語語素)被定義為手勢的基本元素,如手的形狀、方向、位置、和運動對應於口語中的種類。[90][91][92]
書寫系統使用視覺符號代表語言,這可能會或可能不會對應語言的聲音。拉丁字母(以及基於或派生於它的)最初是基於單一聲音的表現,因此單詞通常是由表示一個輔音或元音的結構的字母構成。在音節文字中,如因紐特音節表,每個符號都表示一個音節。在語素文字中,每個符號代表整個詞。[93]並一般不會與這個詞在口語中的發音有聯繫。
由於所有的語言都有大量詞彙,所以並不存在純粹的語標的文字。書面語言代表了口語中的聲音,文字逐個的遵循被安排顯示符號模式,遵循一個特定的方向。書寫系統使用的書寫順序完全是任意的但有一定的慣例。一些書寫系統使用水平方向(像拉丁文字一樣從左到右或像阿拉伯文字一樣從右到左),有一些卻用豎直方向,例如古代中文(從上到下)。一些書寫系統使用交錯行反向書寫的方式,或者其他,例如古瑪雅文字,可以用任意一種方向書寫並可依靠圖形給閱讀者提示閱讀的方向。[94]
為了以書面形式表達世界語言的聲音,語音學家創造了國際音標,用來表達人類語言中所有離散的聲音以有助於理解人類語言的意義。[95]
語法(Grammar)是對語言中能組成話語意義的最基本元素語素的研究。語素既可自由運用,也能連在一起。在話語中自由運用的時候,一般稱作詞,和其他詞或語素連在一起,便稱作詞根或詞綴。語素在語言中的組合方式受規則約束。詞內部結構的規則稱作詞法學,短語或句子內部結構的規則稱作句法。[96]
語法範疇是對句子成分所體現的語義內容和相應語法形式的分類。[97][98][99]同一語法範疇內的要素(語義內容-語法形式)之間是相互對立的,只有一個要素可以作為該語法範疇表現出來。[100]對於句子成分的位置和詞形變化(形態變化),可以分出各種詞類(名詞、動詞等)以體現性、數、格(論元和謂語之間的語法關係,體現主語、謂語等語法功能,格的差異涉及到格在語法形態學上呈現的配列方式的差異)等許多語法範疇。[101]不同語言所覆蓋的語法範疇也不一,有些範疇則非常普遍,幾乎是所有語言共通的,如格。
語言會根據它們的語法功能和在語句中的位置分類為不同的詞類或者稱為詞性。所有的語言都會對物品、概念跟表示行為或事件的詞加以區分,如「狗」和「歌」為名詞,而「跑」和「唱」為動詞。還有一類詞是形容詞,即描述名詞性質或品質的詞,如英語「red」(紅的)或「big」(大)。如果新詞能夠持續地加入到某個詞性中,那麼這個詞性就是開放的,反之則是封閉的。在英語中,代詞屬於封閉詞性,而形容詞則是開放的,一些形容詞可以從動詞(如「saddened」)或名詞(如「-like」後綴,以「名詞+like」的形式轉換)轉換得來。在別的一些語言,如韓語中則正好相反,代詞能夠轉換產生,但形容詞的數目則是固定的。[102]
詞性也能體現不同的語法功能。典型者如動詞作謂語,而名詞則作謂語的論元,即主語和賓語。例如句子「Sally runs」,動詞「runs」作謂語,因為它描述了其論元「Sally」的特定狀態。論元的數目被稱為配價(valence),不同動詞可以有不同配價,持有一個或多個論元。一價動詞只能有一個論元,且一般只能作主語,這種動詞一般被稱為不及物動詞;二價以上的動詞則可以有兩個或以上的論元,主語以外的論元為賓語,這種動詞一般被稱為及物動詞。故配價也時常被稱為及物性。[103]
不同語言還有其他各種各樣的詞類,如連詞連接兩個句子,冠詞(前置詞)引出名詞並界定名詞定性,還有感嘆詞、擬態詞等。很多語言裡面存在量詞,用來定義名詞可數、描述名詞樣態。如日語使用量詞「人」來數人:[104]
而數樹木的時候:
詞法(Morphology)在語言學上指詞的語構成及其過程,對詞法的研究稱為詞法學或者形態學。在大多數語言裡面,合成詞由數個語素構成。例如,「unexpected」一詞可以分析出 un-、expect 和 -ed 三個語素。[105]
語素可以分為詞根和詞綴,詞根可以獨立作為語素存在,而詞綴則必須依附於其他語素。詞綴根據它與詞根的相對位置,又可以分為前綴、中綴和後綴。詞綴會改變、闡釋詞根的語義,通過添加詞綴創造合成詞的方法稱為派生,如動詞「sing」後加上 -er 變為「singer」。與之相對,屈折變化(形態變化)通過改變語素的形態來改變詞的語法功能,進而改變詞義,但並不創造新詞。有些語言通過改變詞的音韻結構的屈折變化來改變詞義,例如英語詞「sing」通過元音變換變成過去時「sang」和過去分詞「sung」。[106]
不同語言依賴形態變化的程度不一,故基於形態和語法的關係產生了形態上的分類。孤立語是低語素單詞比(morpheme-per-word ratio)的語言,並不對語素進行形態變化,而是以語序表示文法關係,如漢語。孤立語同時也是分析語,因為大多數時候單個詞及其語義也是一一對應的(但並非漢語沒有派生),如漢語「不易破損」由不、易、破、損四個自由語素組成,不像英語「unbreakable」一樣由 un-(不自由語素)、break(自由語素)、-able(不自由語素)組成合成詞。[107]包括英語在內的大部分綜合語都允許含有多個語素的合成詞存在,但是根據語素結合的程度即語素單詞比的高低,又可分為屈折語、黏著語和多式綜合語等。屈折語擁有豐富的屈折變化,其語素可有多個語義或語法功能且不可再分解,但語素的結合會受到限制。世界上大多數語言,尤其是印歐語系的語言,都屬於屈折語。如拉丁語「bonus」(好),包括了詞根 bon-(好)和後綴 -us(陽性主格單數)。而黏著語雖有屈折變化,但主要通過在詞根上幾乎不受限制地黏著若干詞綴改變語法功能,其詞綴的語法功能單一,如土耳其語「evlerinizden」通過語素列ev-ler-iniz-den(房子-複數-第二人稱所有格-來自)表示「從你家」的意思。傳統上所謂多式綜合語最為依賴形態變化,綜合程度也最高,通常會將一個句子地內容用一個詞來表示。如波斯語「نفهمیدمش」 nafāmidamesh(我沒搞懂),是由語素列na-fahm-id-am-esh(否定-明白-過去時-第一人稱-第三人稱)組成的,裡面完整包含了表示明白的語素 -fahm- 的主語和賓語兩個論元。又如尤皮克語「tuntussuqatarniksatengqiggtuq」一詞由語素列tuntu-ssur-qatar-ni-ksaite-ngqiggte-uq(馴鹿-打獵-未來時-說-否定-重複-第三人稱單數陳述)構成,表示「他還沒再說他要去抓馴鹿」。在這個例子中,除了 tuntu(馴鹿)以外,其他的所有語素都不自由,不能獨立存在。[108]
在很多語言裡,其句子內的詞的形態會在一些語法範疇上相互保持一致。如很多印歐語系的語言裡,形容詞的形態必須與其修飾的名詞在性、數、格上保持一致,故拉丁語「bonus」(好)所呈現的形態本身就是與某個陽性主格單數名詞保持相互一致的結果。在很多多式綜合語裡面,謂語語素的形態與其主語和賓語即論元保持相互一致。如巴斯克語短語「ikusi nauzu」ikusi n-au-zu(看 第二人稱-助動-第一人稱)意為「你看見了我」,「nauzu」裡面過去時助動語素 -au-(做)同時與前綴 n-(你)和後綴 -zu(我)保持相互一致。[109]
是語言傳遞意義的另一種方式是詞通過一定語序構成句子,在這裡語序這種語法規則稱為句法(Syntax)。句法規則決定了詞序和句子結構的約束形式,以及這些限制對意義起到的作用[110]。例如英語中,像「I love you」(我愛你)一般的英語句子是說得通的,而「*love you I」(愛你我)則說不通[註 4]。又如「The slaves were cursing the master」(奴隸在咒罵主人)和「The master was cursing the slaves」(主人在咒罵奴隸)指的是不同的東西,因為語法上對語序敏感,動詞前面的名詞起到了主語的作用,而跟在動詞後面的名詞則是賓語。相反,在拉丁語中,Dominus servos vituperabat和Servos vituperabat dominus的意思都是「主人在咒罵奴隸」,因為「servos」(奴隸)在形態上是賓格,表明他們是句子的賓語,而「dominus」(主人)是主格,表明他是主語,所以語序調換了也能表達相同的意思[111]。可見拉丁語利用詞法(形態)區分主語和賓語,而英語則使用語序這一句法手段。
句法規則促成意義的另一個例子是許多語種存在的疑問詞移位規則。該規則解釋了為何英語句子「約翰正和露西交談」(John is talking to Lucy)轉變為疑問句時會變成「Who is John talking to?」(約翰在和誰講話)而不是「John is talking to who?」。後者或許著重強調「誰」,使得疑問句的意義稍微發生了變化。短語形成的規則也是句法的一部分,詞可以通過組成短語進入到更大的句法結構的不同位置當中,而短語在不同層次上相互連接,最終以樹狀結構連接成為句子[112]。如右圖,在句法分析中,英語句子「坐在墊子上的貓」(The cat sat on the mat)被分為名詞短語「the cat」、動詞「sit」和介詞短語「on the mat」,其中名詞短語「the cat」由冠詞和名詞構成,介詞短語「on the mat」由介詞和名詞短語構成[113]。這麼分析是因為進行句法操作時這些短語作為單個元素移動,如欲強調「on the mat」時,可以把它作為一個整體前移,得到「[And] on the mat, the cat sat」(墊子上,貓坐著),故它應當被視為一個單元。[113]依據語言的不同假設及其描述,如今有各種各樣的理論提出不同的形式和功能框架,來分析句子、描述語言結構。[21]
語言可依其語法特點分類,一些語言雖分屬不同分支,但二者仍會有不少共同特徵,而且這些共同特徵之間往往有所關聯。[114]比方說,語言可以依據其基本語序,即陳述句中動詞與其他句子成分之間的位置關係進行分類。譬如,英語的基本語序和漢語一樣,是主動賓語序(SVO)如「The snake(S) bit(V) the man(O)」(蛇咬人),而在澳大利亞原住民語言卡米拉羅伊語當中,其基本語序是主賓動語序(SOV),如「d̪uyugu n̪ama d̪ayn yiːy」(蛇人咬)。[115]因為基本語序類型與其他一系列的語法類型要素相對應,如名詞與形容詞的相對順序、前置詞或後置詞等,故語序類型也被視為一種類型要素。這種相互關聯被稱為語言的普遍性,[116]例如大部分(但不是全部)主賓動語序(SOV)的語言裡都存在後置詞而非前置詞,都將形容詞置於名詞之前。[117]
雖然所有語言的句子都由主語、謂語和賓語構成,但不同語言處理語法格和語義角色兩者關係,即格關係的方式不盡相同,故在語法形態學上呈現的配列方式也有所不同。英語屬於主賓格語言,無論是不及物動詞句(如「I run」我跑)還是及物動詞句(如「I love you」 我愛你),其主語(施事 Agent,在不及物動詞句中亦為核心變元 Subject)都是相同形態的前置名詞 I,二者等價。而作通格語言,如卡米拉羅伊語,其不及物動詞句的主語(施事)等價於及物動詞句的賓語(受事 Patient,即 Object),而區別對待及物動詞句的主語。[115]如此,語義角色便能夠以主賓格語言的「主格-賓格」或者作通格語言的「作格-通格」等不同的格關係呈現,甚至像三分型語言那樣,及物動詞句的主語和賓語,以及不及物動詞句的主語分別用三個不同的格來表示。[118]
即便是語言類型學上被劃為相同類型的兩種語言,其共同特徵也有可能是分別獨立產生的。這些特徵成群出現,可能出於統率自然語言結構的普遍規律即語言的普遍性,也有可能是人類在不斷解決溝通問題的過程中其解決方式漸漸趨同的結果。[119]
語言仰仗言語共同體而存在。雖然人類有能力學習任何一種語言,但身處言語共同體中的人類,尤其是兒童,只有在成長環境中有長輩或同伴使用該語言時,他們才會這樣做。語言也在社會溝通之中用以解決大量任務,故語言運用的許多方面可以視為針對這些目的所作的調整。[119]語言在代際或言語共同體之間傳遞的方式會導致語言不斷變化,不斷分化出新語言,或者通過語言接觸相互融合。這個過程類似於進化,其一代代的變化將最終形成一株樹狀語言譜系。[121]
不過,語言與生物有機體的不同之處在於,語言在擴散的過程中因為要與其他語言的說話者接觸,所以很容易融入其他語言的元素。人類還經常會使用多種語言,除了童年時獲得的第一語言,他們在成長過程中還會學習新的語言。當今全球化世界當中語言接觸不斷增加,導致許多小語言正在逐漸瀕危,其使用者轉向使用那些具有更大影響力、能夠面向更大範圍言語共同體的語言。[122]
「意義與記號通過社會習俗相互緊密聯繫」,語義研究基於這一假設來研究意義,但並不研究社會習俗的形成及其影響語言的方式。相反,通常在詞語和記號使用的研究當中,詞語在不同社會背景下會具有不同的含義。例如直示語(Deixis),這一類詞描述說話者與某些實體之間在說話當時的特定時空關係,如「我」(表示說話人),「現在」(表示說話的時刻)和「這裡」(表示說話的位置)。隨著社會習俗的變化,其記號也會逐漸改變其意義。語用學便研究語言表達的意義如何隨語境變化,而 deixis 則是我們利用語言指涉某個實體的重要手段。[123]語用學關注的是語言的使用模式以及這些模式如何促成意義。例如,所有語言的語言表達都既可用於傳遞信息,也可視同付諸行動。某些行為僅訴諸語言就能有實際效果,比如通過「命名」來為某個實體創造一個新名稱,或使用「某人及其妻子」的稱呼來創造婚姻這一社會契約。這類行為被稱為言語行為。當然,它們也可以通過書面或手語來實施。[124]
語言表達的形式往往不與其在特定社會背景中的實際意義相對應。例如,如果一個人在餐桌上問:「你能夠得到鹽麼?」,他並不是真的在問手夠不夠長去拿鹽,而是想讓人幫忙把鹽遞給他。這個意義是由其所使用的語境暗示的;這些意義的影響被稱為會話含義。這些語言運用的社會規則只在某些特定情況下是合適的,不同言語共同體對於其社會背景的理解不同,對語言運用的理解也就不一樣。學習這些內容也是交流能力習得當中非常大的一環。[125]
任何正常發育的健康人都會學習並使用語言。兒童會學習他們自小就充分接觸的一門或多門周圍所使用的語言。而無論手語還是口語,兒童對於它們的學習歷程基本相同。[126]這種學習過程被稱為第一語言習得,它與許多其他類型的學習不同,不需要直接或專業的教學。在《人類的由來》中,博物學家查爾斯·達爾文稱這一過程為「一種獲得藝術的本能傾向」。[14]
儘管正常發育的嬰兒中特定習得階段的時間存在很大差異,第一語言習得的發展順序仍然是相當規律的。從出生開始,相比於其他聲音,新生兒就更容易對人類言語做出反應。大約一個月大的時候,嬰兒似乎就能夠區分不同的語音。大約六個月大的時候,孩子會開始嘮叨,去發出他們周圍使用的語音,或者做出周圍出現的手形。十二至十八個月個月左右嬰兒會開始使用詞語,十八個月左右其平均詞彙量大約是50個詞語。兒童最開始會使用獨字語,即僅用一個詞來表達自己的想法。此後幾個月便會出現雙字語,再隨後幾個月內將開始產生電報式語言或者一些短句子,這些短句子的語法遠比成人語言的語法簡單,但從其語法結構可見規律性。但確表現出規律性的語法結構體。從三歲到五歲左右,兒童說話或者做手語的能力就會發展到和成人相若的程度,其語言習得過程基本完成。[127][128]2013年的研究表明,未出生的胎兒在某種程度上已經能夠獲得語言。[129][130]
通過在日常生活或課程中接觸,人可以在任何年齡習得第二甚至更多的語言。學習第二語言的孩子比成年人更有可能達到母語水平,但一般來說,第二語言使用者很難比得過母語使用者。第一語言習得和額外語言習得之間的一個重要區別是,額外語言習得的過程會受到學習者已知語言的影響。[131]
語言是文化的載體,每個民族的語言都帶有該民族特有的文化印記,不同民族的文化差異可以表現在語言和交際之中,人們在學習第二語言的時候,必然會經歷一些陌生的文化現象,這些文化現象就成為一種理解和使用目的語的文化障礙,可理解為特定言語共同體內的特定語言規範,也是該共同體的大文化的一部分。語言不僅在發音、詞彙和語法上有所不同,其「語言文化」也五花八門。人類利用語言來識別某個文化群體,區別開其他的群體。即使是同一語言的使用者,也會用幾種不同的方式去使用該語言,這每一種方式都表示大文化所隸屬的特定子群。語言學家和人類學家,特別是社會語言學家、人類語言學家和語言人類學家,專門研究說話方式在言語共同體之間的變化。[132]
語言學家使用「語言變體」這一術語來指代說一種語言的不同方式,它包含了地理或社會文化意義上的方言和語域,以及次文化當中的語體。語言人類學家和語言社會學家將交流語體定義為在特定文化中使用和理解語言的方式。[133]
由於語言使用規範由特定群體的成員共享,因此交流語體也成為展示和構建群體身份的一種方式。語言差異可能成為社會群體之間劃分的顯著標誌,例如,說一口帶有特定口音的語言可以代表一個人的少數民族或少數社會階層身份、其祖籍或者他作為第二語言使用者的地位。這些差異不是語言系統的一部分,而是人們如何使用語言作為構建群體的一種重要的社會工具。[134]
然而,許多語言也會用一些語法慣例標記社會等級或社會對立,來凸顯說話者絕對或相對的社會地位。在許多語言中,男女之間、年齡層之間或社會階級之間說話的方式存在語體甚至語法上的差異,就像某些語言根據聽話者是誰而使用不同的詞語一樣。例如,在澳大利亞的迪爾巴爾語中,已婚男子在其婆婆面前講話時,必須使用一套特殊的詞語來提及日常用品。[135]又例如,一些文化裡面有精妙的「社交直示語」系統,或通過語言手段表達社交距離的系統。[136]在英語中,社交直示語主要通過區分姓氏和其他姓氏,以及「夫人」、「醫生」或「閣下」等頭銜來識別某些人。但在其他語言中,這種系統可能非常複雜,並且並覆蓋到語言的整個語法和詞彙當中。例如,在東亞語言中,如泰語、緬甸語和爪哇語,說話者會根據他和聽話者在等級體系中的相對位置來使用不同的單詞,其中動物和兒童等級最低,神和皇室成員等級最高。[136]
歷史長河當中,人類發明了許多用圖形媒介表示語言的方式,這些方式被稱為書寫系統。
書寫令語言對人類更加有用處。它可以在人體外部儲存大量信息,並可重複檢索、允許長距離交流,原本僅靠語音和手語是沒辦法做到這一點的。許多語言具有不同的體裁、語體,區分書面語和口語,甚至在一部分語言共同體裡面,書面語與口語在很大程度上是分開的,如粵語。有證據表明,書寫的運用也會對人類的認知發展產生影響,這可能是因為獲得識字通常需要正確而正規的教育。[137]
書寫系統最開始發明於公元前4千年後期青銅時代初葉。蘇美爾古老的楔形文字和埃及的象形文字通常被認為是最早的書寫系統,它們都脫胎於公元前3400-3200年左右出現的原始文字符號系統,而最早的連貫文本在公元前2600年左右出現。人們普遍認為蘇美爾人的文字獨立發明的,而對於埃及文字是完全獨立於蘇美爾而發明的,還是文化傳播而來的,則頗具爭議。對於在公元前6000年左右發展起來的漢字也存在類似的爭論。人們普遍認為前哥倫布時期的中美洲書寫系統(包括奧爾梅克和瑪雅文字)具有獨立的起源。[94]
所有語言都會隨著說話者採用或發明新的說話方式而發生變化,而且這些變化會在言語共同體內擴散。語言變化是全方位的,語言會在語音、詞彙、形態、語法甚至語用等任何層面發生變化。儘管語言變化最初往往消極對待這些變化,認為這是一種語言消退或語言規範的弱化,但這變化實乃自然而且不可避免的。[138]
語言變化可能會影響特定語音或整個語音系統。語音變化包括語音或語音特徵的替換,這種替換會導致原有語音損失,甚至完全變成以前沒有的新語音。語音也會因應其前後的語音而變化。語音變化通常具有規律性,故無論無論滿足結構條件與否,語音都會成體系地變化,任何非語音因素都可以忽略。但體系性變化並不絕對,語音變化也常有僅影響一個或幾個詞地個例。有時個別的變化會觸發語音系統的鏈式音移,如日耳曼語族所有的塞音都曾發生過鏈式音移,最開始 *bʰ 變為 /b/,導致原來的 *b 變為 /p/,然後又導致原來的 *p 變為 /f/。這一過程被稱為格林定律。這也可以解釋為何義大利語族裡面 p 開頭的詞 pater 和 pisces 對應到日耳曼語族裡面就會變成 p 開頭的 father 和 fish。[139]鏈式音移的另外一個著名例子是英語的元音大推移,這是現代英語正寫法與發音不一致的主要原因。
語音變化的另外一種原因是元音縮合,即由於發音模糊等原因,兩個獨立的詞裡面大量音素脫落,逐漸縮短為一個詞當中的兩個音節甚至兩個語音的現象。例如拉丁語 mea domina 後來變成了法語中的 madame 和美國英語中的 ma'am。[140]
語言在語法層面也會發生變化,這些現象常常在詞或詞素脫落,且語法系統無意識地重組予以代償時發生。例如,標準西班牙語利用屈折變化 -s 來標記動詞第二人稱,但一部分加勒比海西班牙語當中 -s 脫落,導致它們只能前置人稱代詞 tú 來表示第二人稱。故西班牙語當中 ¿como te llamas? [ˈkomo te ˈjamas](「你叫什麼名字?」)這一句子到了加勒比海地區就變成了 ¿como tú te llama? [ˈkomo tu te ˈjama]。故細微的語音變化也會影響形態和語法。[141]語法變化的另外一個常見原因是某些特定話語模式的固化即語法化,如熟語的形成等。例如英語 going to 失去了其進行體和運動的含義,成為了將來時的標誌,在某些英語方言裡面這種變化非常徹底(如 I'm gonna)。
語言變化可能會受到其內部因素推動,例如特定語音在難以聽辨或發音的情況下就會促使語音變化,或者通過成體系的變化使一些罕見的語言結構常態化。[142]語言變化的另外一些因素則是社會性的,例如當某些發音代表了特定群體、社會階層或意識形態集團的時候,希望進入這些群體的人就會模仿、採用那些發音,客觀上就發生了語音變化。故身份構建和政治議題也會對語言結構產生深遠影響。[143]
語言接觸也是導致語言特性在語言之間傳播的重要原因。當兩種語言或語言變體的使用者定期互動,就會發生語言接觸。[144]多語制可能一直是人類歷史的常態,現代世界的大多數人都能說多門語言。在民族國家的概念興起之前,單語制一般只是島嶼居民的特徵。但是,民族主義意識形態使得一個國家,一種語言的觀念廣為世人接受,單語制也就流行了開來。儘管如此,世界上約250個國家當中卻存在大約6000種語言,說明大多數國家裡面還是存在多種語言,故大多數語言仍然都會與其他語言密切接觸。[145]
當不同語言的使用者密切互動,他們的語言往往會相互影響。長時間的語言接觸過後,一個語言特徵會在不同的語言當中擴散,使得不同系屬的語言得以趨同。這可能會在許多語言密切接觸的地區產生語言聯盟,當中互不相關的語言開始共享大量語言特徵。有記錄的語言聯盟包括巴爾幹語區、中美洲語區和衣索比亞語區。此外,由於特定地域特徵的廣泛擴散,南亞、歐洲和東南亞等一些較大的地區有時被視為語言聯盟。[146][147]
語言接觸也會導致其他語言現象,如語言融合、詞彙借用甚至詞彙重置(本土詞彙漸漸被優勢語言的借詞所取代)。在極端而持續的語言接觸下,它可能導致形成一些新的混合語言,這些混合語言難以被歸類到單一語言系屬中去。例如皮欽語,這類混合語言形成於不同語言的成年使用者之間的定期接觸,通常他們都不會說對方的語言,但是通過皮欽語可以構建一種簡化了各自語法和語音體系,但同時又具有兩方語言特徵的交流方式。皮欽語也因此不會有母語使用者,定義上皮欽語的使用者都用另外一種語言作為第一語言。但如果一種皮欽語成為了某個言語共同體的主要語言,那麼皮欽語就會成為這個言語共同體裡面兒童的母語,並隨著這些兒童長大而在結構上變得更複雜。這些語言就另稱之為克里奧爾語,例如巴布亞皮欽語,它是巴布亞紐幾內亞的官方語言,起初源於英語和南島語;還有海地克里奧爾語,以及加拿大的米奇夫語等。[148][149][150]
「民族語」網站把「活的語言」(仍在使用的語言)定義為「一門至少擁有一名母語使用者的語言」。目前已知的「活的語言」的準確數量為6,000-7,000種之間,這種差異可歸因於「統計者如何定義語言」以及「如何區分語言和方言」這兩點。截至2016年,「民族語」記錄了7,097種活的人類語言。[153]「民族語」基於語言的相互理解性研究劃分語言,故其劃分的語言種類來得比一般較為保守的分類多,如丹麥語一般被視為一種單一語言,其下存在兩種方言,而「民族語」則視之為丹麥語和日德蘭語兩種獨立語言。[151]
「民族語」網站也顯示,389種語言(約占總數6%)的使用者數達100萬以上。所有這些語言的使用者總數占世界總人口的94%,而剩下94%的語言的使用者只占世界人口的6%。右表是「民族語」估算得出世界上使用者數前十的語言及其使用者數(2009年數據)。[151]
語言學家馬克斯·魏因賴希有句十分有名的論述,「語言就是有著陸軍和海軍的方言」(a language is a dialect with an army and navy.)[154],儘管如此,語言與方言之間並無明顯界限,而政治上的邊界往往會影響語言變體作為語言或方言的區分。例如,客家語、粵語和官話常被視作漢語的方言,儘管其差異更甚於挪威語及其衍生語言瑞典語之間的差異。南斯拉夫內戰以前,塞爾維亞-克羅埃西亞語被視為同一語言的兩種方言,但現在克羅埃西亞語和塞爾維亞語分別使用拉丁字母和西里爾字母,同時也被視為不同的語言。換言之,語言的區分不僅取決於文化差異、文字系統、相互理解性,也取決於政治考量。[155]
世界上的語言可以依據其共同祖語等親緣關係,大致按照語門>語系>語族>語支>語言>方言的層次劃入不同的語言系屬分類,實際上分類層次可能更多更複雜。目前已被認定的語言系屬有上百種,但隨著今後研究深入發掘更多證據,一些系屬可能會被劃入更大的分類裡面。同時,目前也有數十種語言被列為孤立語言,尚無法找到它們與其他語言之間的關聯,如西班牙的巴斯克語、美國新墨西哥州的祖尼語、墨西哥的塔拉斯坎語、日本的阿伊努語和巴基斯坦的布魯夏斯基語等等。[156]還有一些小語系未列出。
印歐語系語言的使用者最多,達全球人口的46%[157],其中包括了英語、西班牙語、俄語、印度斯坦語(印地語和烏爾都語)等主要語言。它們首先經民族大遷徙(公元400—800年)擴散到歐亞大陸各處,[158][159]而後又隨著歐洲的殖民擴張在非洲和美洲取得了政治上乃至規模上的主導地位。漢藏語系語言占全球人口的20%[157],主要分布在東亞,包括漢語的官話、客家話、粵語,及其他數百種更小的語言。[160][161]
非洲大地上存在更多的語言系屬,其中分布最廣的是尼日-剛果語系,包括斯瓦希里語、修納語和約魯巴語等,占世界人口的6.9%。[157]亞非語系在非洲的規模則稍微少一些,但其中閃米特語族也有大量使用者,包括阿拉伯語、希伯來語等,以及分布於撒哈拉沙漠的豪薩語和柏柏爾語族諸語。[160][161]
南島語系的使用者占全球人口的5.5%,覆蓋了從馬達加斯加到東南亞各群島乃至大洋洲的廣闊範圍。[157]南島語系包括了馬拉加斯語、毛利語、薩摩亞語以及印度尼西亞和台灣的原住民語言等。南島語於公元前3000年左右發源於台灣,後利用先進的航海技術沿諸多島鏈擴散到大洋洲各處。其他主要的語言系屬包括南亞的達羅毗荼語系(包括卡納達語、泰米爾語和泰盧固語等)、中亞的突厥語族(屬阿爾泰語系,如土耳其語)以及東南亞的南亞語系(如高棉語)和侗傣語系(如泰語)。[160][161]
有些地方語言多樣性非常豐富,如美洲、巴布亞紐幾內亞、西非和南亞等,會存在上百種小的語言系屬。儘管人數上並不占優,這些地方的語言占據了世界語言總量的多數。主要有南美洲的克丘馬拉語系、阿拉瓦克語系和圖皮-瓜拉尼語族,中美洲的猶他-阿茲特克語系、歐托-曼格語系、馬雅語系,以及北美洲的納-德內語系、易洛魁語系和阿爾岡昆語族等原住民語言。在澳大利亞,大部分原住民語言都屬於帕馬-恩永甘語系。而新幾內亞除了南島語,存在大量小系屬和語言島。[156]
當一門語言的絕大部分使用者死亡或者轉向說另外一門語言時,這門語言就陷入瀕危狀態。如果不再有人那它當作母語,那麼它就會成為死語;再往下去,如果完全沒有人使用這門語言,那麼它就會滅絕。語言滅絕一再在人類歷史上發生,但20世紀以來的新殖民主義和全球化加劇了這一趨勢,經濟上強大的語言凌駕再其他語言之上,使用人數較少的語言瀕臨危機。[4]
目前尚不清楚世界上總共有多少種語言,其統計取決於很多因素。一般認為截至2010年,世界上共有6,000[162]至7,000種語言,其中50%至90%將在2100年前滅絕。[4]世界上50%的人口使用排名前20種語言,每種語言都超過5000萬人,而其他許多語言都只在小範圍使用,其中大部分語言的使用者不到1萬人。[157]
聯合國教科文組織將語言瀕危程度分為五級:「脆弱」(兒童只在家庭使用)、「危險」(沒有兒童使用)、「重大危險」(主要使用者為老人)、「極度危險」(主要使用者僅為老人,且不作為第一語言使用)和「滅絕」。儘管一直有思潮認為將語言統一為英語或者世界語等通用語言會更好,但普遍觀點認為語言的消失會損害世界文化多樣性。而反觀聖經舊約中關於巴別塔的敘述,人們也普遍認為語言多樣性會導致政治衝突,但也有觀點認為這與世界上許多重大暴力事件的事實相違背,如南北戰爭和南斯拉夫內戰,又或者是盧安達的種族滅絕,發生這些事件的地區語言多樣性都比較低;而很多穩定的政治單位都是高度多語化的。[163]
許多項目致力於振興瀕危語言和促進少數民族語言的教育和識字來預防或減緩這種損失。在世界範圍內也許多國家專門立法保護和穩定原住民言語共同體的語言。少數語言學家認為語言喪失作為一種自然過程不應該人為抵消,為後代記錄瀕危語言足矣。[164]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.