字母顺序 (alphabetical order),全称字母表顺序 ,简称字母序, 简单易用,是拉丁文字的传统排检法。 英文的词典、索引和词表等都普遍采用字母顺序,中文的新华字典和现代汉语词典等许多辞书正文所采用的汉语拼音排检法也属于字母顺序。[1]
字母顺序排检法具有悠久的历史,其基本原则是根据单词中的字母在字母表中的前后顺序来决定单词之间的顺序。下文作较为全面的介绍,并根据中文的具体需要,增加《汉语拼音排序法》的内容。[2]
历史
据历史记载,人类大概在距今三千多年前的埃及西部发明字母顺序。但这种文字排序法在之后的几个世纪内一直没有受到重视。
学者们第一次有效地使用字母顺序作为编目工具可能是在古代亚历山大图书馆(建于公元前 300年左右)时期。其中的书卷按作者姓名首个字母的字母顺序进行放置。
12世纪下半叶,字母顺序作为咨询的辅助工具开始进入西欧知识分子生活的主流,当时开发了字母工具来帮助传教士分析圣经词汇。字母顺序的采用是从记忆至上到书面作品至上的一种过渡。
1604年,第一本单语英语词典Table Alphabeticall[5][6]采用字母顺序编排,现今的许多参考书和列表的条目排列都是基于这种顺序。
基本规则
每一个拉丁文字系统(例如英文)都拥有自己的字母表(alphabet),即一个用来书写该语言的有序字母集合[7]。现行国际标准ISO基本拉丁字母表 (ISO basic Latin alphabet)[8] 是:
大寫字母集: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 小寫字母集: a b c d e f g h i j k l m n o p q r s t u v w x y z
判定两个单词(字符串)先后顺序的基本规则 [9] [a]是:
- 先比较两边的第一个字母,如果不同,则根据它们在字母表中的先后关系来定序,位置靠前的字母所在的字符串排在前面 (例如,英文单词cat先于dog, 因为字母c在字母表中位于字母d的前面)。
- 如果两个首字母相同,则比较双方的第二个字母,以此类推,直至找到第一对不相同的字母并据此定序 (例如,英文单词what先于why,因为第三个字母a先于y)。
- 如果比较到其中一个字符串的最后一个字母,双边的字母还是相同,那么较短的字符串排在前面 (例如,alphabet先于alphabetical)。
上述几个例子的综合字母序是:
alphabet, alphabetical, cat, dog, what, why.
辅助规则
在实际排序中有时会出现基本规则未能涵盖的问题,包括大小写字母、字母表之外的字符,或者需要根据语言习惯作相应调整的情形。这时就需要辅助规则[10][11]。
大小写字母在排序时一般被看成是一样的。但如果有需要,可以对只在大小写字母方面有区别的字符串做合乎语言习俗的处理。通常是将大写的排前,例如,汉语拼音方案的字母表:Aa Bb ... Zz。 又如,《牛津高阶英汉双解词典》 中有这样的词条排列: MS, Ms, Msc. [12]
如果待排序的字符串含有多个词(中间常用空格或连词符号隔开),这时有两种处理方法:
- 第一种方法是先按第一个词排序,第一个词相同的再按第二个词排,以此类推。例如英文:Oak; Oak Hill; Oak Ridge; Oakley Park; Oakley River。
- 第二种方法是忽略空格等分词字符,看成一个连续的字母串来排。这样,以上词语的序列变为:Oak; Oak Hill; Oakley Park; Oakley River; Oak Ridge.其中的 Oak Ridge 移到了最后。
如果一个短语以一个非常常见的冠词如“the”、“a”或“an”开头,则该词有时会被忽略或移至短语的末尾。 例如,书名“The Shining”可能会被视为“Shining”或“Shining, The”,因此会出现在书名“Summer of Sam”之前。 然而,它也可以被简单地视为 "The Shining" 而排在 "Summer of Sam"之后。 《牛津高阶英汉双解词典》 有这样的条目顺序:“ official secret, the Official Secrets Act, officiate”。用的是前面的方法。
指两个或多个字母合并为一个符号,例如英语中的 Æ 和 Œ。这种连字符号通常被视作字母是分开的,即Æ 和 Œ分别当作AE 和 CE,而 æther 就按照 aether 来参加排序。
对于修改了形状的字母,不同的语言可能有不同的处理方法。例如,法语中把带附加符号的字符都当作基本字符来排序,例如 rôle 当作role,排在 rock 和 rose中间。德语的“电话簿序”中,Ä, Ö, Ü当作 "ae", "oe", "ue" 来排序。西班牙语的Ñ作为一个单独字母排在N之后.
数字和标点符号等非字母字符也有不同处理方法,一种是把它们排在所有字母之前 (例如, 《牛津高阶英汉双解词典》 有这样的条目顺序: “MP, MP3, MP3 player, MP4, MPEG”,把数字排在字母之前)。 另一种方法是按其读音的对应词语来处理,例如,1999 按英语 nineteen nighty-nine 的拼写来排列。
汉语拼音排序法
这是根据汉语拼音方案所采用的基本拉丁字母表的顺序来排列汉字。[2] 中文的新华字典和现代汉语词典等许多辞书的正文都用汉语拼音排检法。
汉字的拼音排序步骤如下:[1]
- 根据每个字的拼音字母串,按照字母表的顺序排列。其方法是先按第一个字母在字母表的顺序排列,如第一个字母相同,再按第二个字母的顺序排列,以此类推。例如,"男女员工齐努力" 排序为“工(gōng) 力(lì) 男(nán) [女(nǚ) 努(nǔ)] 齐(qí) 员(yuán)”。圆括号内为拼音。[女(nǚ) 努(nǔ)]基本拉丁字母都是nu,暂时不能定序。
- 拼音字母相同的字,如果同时存在e和ê音节,或者nu和nü,或者lu和lü, 则根据新华字典《汉语拼音音节索引》规定的顺序,将发ê音的字排在紧跟e音的字的后面,nü音的字紧跟nu音的字的后面,lü音的字紧跟lu音的字后面。[2] 例如“额 (è) 欸(ê̄)”,“路(lù) 驴(lǘ)”,“努(nǔ) 女(nǚ)”。
- 如果声韵母都相同,按声调顺序“1声、2声、3声、4声、5声(轻声)”排列,如“妈(mā) 麻(má) 马(mǎ) 骂(mà) 吗(ma)”。
将上面的例字综合起来的拼音字母顺序是
“工(gōng)力(lì) 媽(mā) 麻(má) 馬(mǎ) 罵(mà) 嗎(ma) 男(nán) 努(nǔ) 女(nǚ) 齊(qí) 員(yuán)”。
用汉语拼音字母排列汉语单字的详细顺序可参见新版新华字典 [13] 的“汉语拼音音节索引”(这是一个不带声调的音节顺序列表) 或 现代汉语词典 [14] 的“音节表”(带声调的音节顺序列表)。
拼音表达式完全相同的字,即声韵调相同的完全同音字,通常是借助笔划排检法来排序。
含有多个字的单词有两种不同的排序方式可供选用 [15]。
注释
参见
参考资料
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.