Loading AI tools
来自维基百科,自由的百科全书
字母顺序 (alphabetical order),全称字母表顺序 ,简称字母序, 简单易用,是拉丁文字的传统排检法。 英文的词典、索引和词表等都普遍采用字母顺序,中文的新华字典和现代汉语词典等许多辞书正文所采用的汉语拼音排检法也属于字母顺序。[1]
字母顺序排检法具有悠久的历史,其基本原则是根据单词中的字母在字母表中的前后顺序来决定单词之间的顺序。下文作较为全面的介绍,并根据中文的具体需要,增加《汉语拼音排序法》的内容。[2]
据历史记载,人类大概在距今三千多年前的埃及西部发明字母顺序。但这种文字排序法在之后的几个世纪内一直没有受到重视。
学者们第一次有效地使用字母顺序作为编目工具可能是在古代亚历山大图书馆(建于公元前 300年左右)时期。其中的书卷按作者姓名首个字母的字母顺序进行放置。
12世纪下半叶,字母顺序作为咨询的辅助工具开始进入西欧知识分子生活的主流,当时开发了字母工具来帮助传教士分析圣经词汇。字母顺序的采用是从记忆至上到书面作品至上的一种过渡。
1604年,第一本单语英语词典Table Alphabeticall[5][6]采用字母顺序编排,现今的许多参考书和列表的条目排列都是基于这种顺序。
每一个拉丁文字系统(例如英文)都拥有自己的字母表(alphabet),即一个用来书写该语言的有序字母集合[7]。现行国际标准ISO基本拉丁字母表 (ISO basic Latin alphabet)[8] 是:
大寫字母集: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 小寫字母集: a b c d e f g h i j k l m n o p q r s t u v w x y z
判定两个单词(字符串)先后顺序的基本规则 [9] [a]是:
上述几个例子的综合字母序是:
alphabet, alphabetical, cat, dog, what, why.
在实际排序中有时会出现基本规则未能涵盖的问题,包括大小写字母、字母表之外的字符,或者需要根据语言习惯作相应调整的情形。这时就需要辅助规则[10][11]。
大小写字母在排序时一般被看成是一样的。但如果有需要,可以对只在大小写字母方面有区别的字符串做合乎语言习俗的处理。通常是将大写的排前,例如,汉语拼音方案的字母表:Aa Bb ... Zz。 又如,《牛津高阶英汉双解词典》 中有这样的词条排列: MS, Ms, Msc. [12]
如果待排序的字符串含有多个词(中间常用空格或连词符号隔开),这时有两种处理方法:
如果一个短语以一个非常常见的冠词如“the”、“a”或“an”开头,则该词有时会被忽略或移至短语的末尾。 例如,书名“The Shining”可能会被视为“Shining”或“Shining, The”,因此会出现在书名“Summer of Sam”之前。 然而,它也可以被简单地视为 "The Shining" 而排在 "Summer of Sam"之后。 《牛津高阶英汉双解词典》 有这样的条目顺序:“ official secret, the Official Secrets Act, officiate”。用的是前面的方法。
指两个或多个字母合并为一个符号,例如英语中的 Æ 和 Œ。这种连字符号通常被视作字母是分开的,即Æ 和 Œ分别当作AE 和 CE,而 æther 就按照 aether 来参加排序。
对于修改了形状的字母,不同的语言可能有不同的处理方法。例如,法语中把带附加符号的字符都当作基本字符来排序,例如 rôle 当作role,排在 rock 和 rose中间。德语的“电话簿序”中,Ä, Ö, Ü当作 "ae", "oe", "ue" 来排序。西班牙语的Ñ作为一个单独字母排在N之后.
数字和标点符号等非字母字符也有不同处理方法,一种是把它们排在所有字母之前 (例如, 《牛津高阶英汉双解词典》 有这样的条目顺序: “MP, MP3, MP3 player, MP4, MPEG”,把数字排在字母之前)。 另一种方法是按其读音的对应词语来处理,例如,1999 按英语 nineteen nighty-nine 的拼写来排列。
这是根据汉语拼音方案所采用的基本拉丁字母表的顺序来排列汉字。[2] 中文的新华字典和现代汉语词典等许多辞书的正文都用汉语拼音排检法。
汉字的拼音排序步骤如下:[1]
将上面的例字综合起来的拼音字母顺序是
“工(gōng)力(lì) 媽(mā) 麻(má) 馬(mǎ) 罵(mà) 嗎(ma) 男(nán) 努(nǔ) 女(nǚ) 齊(qí) 員(yuán)”。
用汉语拼音字母排列汉语单字的详细顺序可参见新版新华字典 [13] 的“汉语拼音音节索引”(这是一个不带声调的音节顺序列表) 或 现代汉语词典 [14] 的“音节表”(带声调的音节顺序列表)。
拼音表达式完全相同的字,即声韵调相同的完全同音字,通常是借助笔划排检法来排序。
含有多个字的单词有两种不同的排序方式可供选用 [15]。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.