在语言学中,词(英语:word),在台湾又称为单字,在中国大陆外语教学中又称为单词,是能独立运用并含有“语义内容”或“语用内容”(即具有表面含义或实际含义)的最小单位。词的集合称为“词汇”,例如:所有中文词统称为“中文词汇”等。词典是为词语提供音韵(phonology)、词义解释、例句、用法等等的工具书,有的词典只修录特殊领域的词汇。
从语法单位来说,词比语素(morpheme )大(语素含有语意,但不一定能独立运用),而又比词组小(又称短语,由词构成)。一个词可能只会有一个语素,(例如英语的 oh!、rock、red、quick、run、expect 等),但也有可能有很多个(例如 rocks、redness、quickly、running、unexpected)。而语素可能不能独立存在(例如 -s,-ness,-ly,-ing,un-,-ed)。一个复杂的词通常会包括一个词根和一或多个词缀(rock-s,red-ness,quick-ly,run-ning,un-expect-ed),但合成词可能会有多于一个词根(black-board(黑板),rat-race(激烈的竞争))。构词学是研究词的内部结构和形成方式等的语言学分支。
词可以拼凑起来组成更大的语言单位,例如:词组(a red rock),子句(I threw a rock)和句子(He threw a red rock too but he missed.)。
“词”这个术语可以指口语的词或书面语的词。口语的词是由音位(音素/phoneme)所组成的,是语言中能够区别意义的最小声音单位。书面语的词则是由字位(形素/grapheme)所组成的,拉丁文字里的每个字母或中文的每个汉字都是一个字位。
定义
帮一个词取定义的难易度取自于语言。部分字典将它的词汇分类成词元(若词库里有ran和run,因ran是run的过去式,所以run是词元),代表一个词怎么构成取自于作者在该语言的想法。
在1926年,伦纳德·布龙菲尔德提出了“最小自由形式”的概念。词常常被认为是人类言语中,能自行独立存在的最小单位。[1]而这跟音位和词素有关。但有些书面文字不是最小自由形式,因为当他们被单独念出来时,没有任何意义。[2]
很多语义学家提出了“语义元”的理论,指的是不可定义的词代表着在直觉上有意义的基本概念(像 the 或 of)。根据这项理论,语义元是描述一个词的含义的基础,且没有与任何一个词或与它们相关的概念上的意义产生循环。[3] [4]
在句法学中最简方案(Minimalist Program)的学派中,词(在文献中称为“词项”)在被诠释为一束一束的“语言特性”,并合并成一个有形式和含义的结构。[5]举例来说,英文词“bears”有语义(以表示“熊”),词性(为名词),数(为复数,须与其域内(如所在的子句或词组)的其他成分(如动词、指示词等)达成一致)和音韵(能被念出来,国际音标:[bairz]),等等特性。
在不同的语言中,词分界会呈现出不同的面貌。例如以拉丁字母并写的语言,词呈现为以空格来区分的一串字母;在书写中文时,词由一个或多个汉字构成,但词和词之间没有用空格区分;在口语中,词有固定的语音形式,词的语音变化通常只出现在其开端和结尾,而词之间可以停顿。
要界定什么构成词,将牵涉到词在哪里开始和结尾—换句话说,即是定义“词的分界”。有多种方式可以指出词的分界在哪:
- 句子中潜在的停顿
-
- 说话者被要求念同一个句子两遍,中间必有停顿。说话者会在词的分界中加上停顿。但这个方法并非是万无一失的:说话者可能故意将多音节的词拆开,或将两或多个有关连的词从中分开。
- 词的不可分割性
-
- 说话者被要求念一个句子,并再被要求念同一个句子一次,但在第二次时加上其他在第一句未曾出现过的词。例如:I have lived in this village for ten years“我已在这个村子里生活了十年”变为 My family and I have lived in this little village for about ten or so years“我和我的家人已在这个小村庄再了十几年。)这些词会被说话者加到原句中词的分界里。但是在一些语言里,有被放进词的中缀的存在。类似地,有些语言里,有被分开的词缀的存在;例如在德文中:“ "Ich komme gut zu Hause an."(我在家里很好)”,动词ankommen(到达)是分离的。
- 用声音来定义词的分界
- 用拼字来定义词的分界
在能被书写的语言里,一个词与它的正写法有相互关系。使用字母来拼写的语言中,词之间常出现分隔符号(尤其是空格)在有用字母系统现代语言里很常见,但分隔符号与字母系统相比,算是较创新的做法。
不过,书写上的分隔不一定等于词的分界。例如在英文正写法里,有些合成词里可能会含有空格。例如ice cream(冰淇淋),air raid shelter(壕),get up(起床)等由于以空格分开,故被视为多个词。(ice、cream、air 等字无疑是以自由形式,但 get 较不明确。)相反地,brownstone(上流社会)拼成一个词也被视为一个词,虽然 brown 和 stone 都是以自由形式存在的。
此外,书写上的分隔有时只反映语音上的分界而非词的分界。例如在越南语正写法里,虽以拉丁字母拼写,但却以“单音节语素”而非词来划定书写的分隔。在东亚语言里(用CJKV的语言),也用音节(中文的汉字)和音拍(日文的假名)而非完整的词来划定书写的界线。在韩文里的谚文里,音节和词两者有书写上的分界:由音节来组成方块字,但也在词之间加上空格)。
相反地,部分综合语用语素组成词,与分析语相比,更难让人难以归结词。尤其在多式综合语里(如因纽特语和尤比克语),特别难划定词间的界线,因为一个句子可能只有一个词。
在中文里,词(word)有时会和字(character)混淆。词是一个语法单位,而字是一个书写单位。 汉字是中文的书写单位,通常一个汉字表示一个音节(普通话中的儿化是例外,一个音节由两个汉字表示)。所以汉字与词没有直接的对应关系,一个词可以只占一音节并由一个汉字写成(例如“我”、“死”、“很”),也可占多个音节并以多个汉字写成(例如“维他命”、“个性”、“独特”)。
词法学
词由语素(不可分割的音义结合体)构成。由一个语素组成的词称为单纯词,而由多于一个语素构成的词称为合成词。
以中文为例,单纯词多数是单音节的,例如“地”、“东”、“五”、“看”等;除单音节词外,也有多音节的单纯词,例如“玲珑”、“参差”、“徘徊”、“叮咛”、“鹦鹉”、“马虎”、“葡萄”、“卡通”、“巧克力”、“葡萄牙”、“马达加斯加”等,它们不论音节数目多少,都不能分拆为词义相关的较小部分。另一方面,现代中文有许多合成词,例如“政府”、“学者”、“石头”、“民主”、“问责制”等,这些词都可以分为更小的单位,并且这些小单位是构成词义的元素。
以英语为例,词 lady 可分割为两个音节(可以用 la 和 dy 表示),但它们却不带任何意义与 lady 的词义相关,所以 lady 是单纯词。blackboard 也是一个词,它可以分为 black 和 board 两个部分,而且它们所带的意义与 blackboard 的词义相关,所以 blackboard 是合成词。
在语言类型学中,词和语素的关系是语言分类的一种方法——语言的型态分类:综合语是指该语言有着高的语素词比(morpheme-per-word ratio),即每个词平均包含语素数目较多,例如拉丁语;相对地,分析语的语素词比较低,例如汉语。
在综合语里,一个语干(例如:love“爱”)可能会有多个词形(例:loves,loving,loved)。但在某些情况下,他们不会被视为不同的词,而是有不同词形的同一个词。在这些语言里,词可能是由多个语素所组成的。尤其是在印欧语系里的语言里,不同的语素可能是:
例如,原印欧语系词*wŗdhom可以被分析成四个部分:
分类
词有许多的分类准则和方式,下举数例:
- 依音节的数目分类:即单音词、双音词、多音词等。某些文学作品如诗词、对联等,这种分类有其特殊的重要性。
- 依语素的数目:单纯词只有一个语素,合成词有多于一个语素。
- 合成词可以依构词形式进行分类:例如中文的合成词有联合式、偏正式、主谓式、动宾式、补充式、重叠式、附加式,其中首五类合成词又叫做复合词。英语的合成词有复合词和派生词两大类。
- 依词的语法性质(即“词性”、“词类”):例如名词、动词、副词、连词等。日语的词可分为用言和体言两大类。传统的中文语法研究把中文词汇分为实词和虚词。
- 依词的来源:例如词可以分为固有词和外来词。
事实上,词的分类不限于此。此外,从上例中也可以看出,不同的语言对词可以有不同的分类准则,或即使分类准则相同但具体的分类方式也因语言而别。
“词类”一词不是以上各种词的分类准则和分式的统称,而是专指词的语法性质分类,与上述的“词性”相通。依据语法性质,一个语法将一个语言的词汇分成好几个组。其中,最基本的二分法(几乎适用于所有语言)是名词和动词。
希腊文字学家狄俄尼索斯·特拉克斯是首先将文字分成许多个组的人。他把希腊文的词汇分成:名词,动词,形容词,代名词,介词,副词,连接词和感叹词。
基本上每个完整的子句都有一个动词。例如:
- “他正在读书。”(在这句“读”字是动词)
- “小鸟在天空飞。”(在这句“飞”字是动词)
但在中文句子中,动词的原形“是”字可以被隐去。例句:
- “生命是美好的!”(在这句“是”是动词,可写作“生命美好!”)
- “你真是聪明。”(在这句“真是”是动词,可写作“你好叻。”)
形容词是词类中的一类。其根本特点是自由的作定语、修饰名词或名词性短语。在语义上,形容词多表示性质、状态、属性、描述等含义。
例子有:漂亮、高兴等。
代名词是指代替名词或名词短语的形式词(是否附加限定词各个语言不同),如中文的“你”、“我”、“他”,法语的“nous”、“elle”,英语的“he”、“she”、“ it”等。问句中代替被询问物体的代词叫做疑问代词,比如“谁”等。
哲学
至少从公元前5世纪开始,哲学家们就对词的意义开始着迷,形成了语言哲学的基础。柏拉图根据词的来源和构成它们的声音来分析词。他认为,尽管词随时间演变了很多,但在声音和意义之间仍旧有一些联系。约翰·洛克说过,“字眼底功用就在于能明显的标记出各种观念”,人们选择字眼“并非因为特殊的音节分明的声音和一些观念之间有一种自然的联络,因为若是如此,则一切人底语言应该只有一种。语言所以有表示作用,乃是由于人们随意赋予它们一种意义,乃是由于人们随便来把一个字当做一个观念底标记”。 [6]维特根斯坦对词的看法由一个词是一个意思的代表演变到“一个词的意义就是它在我们语言中的用法(Meaning is using)”。[7]
参考文献
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.