基本拉丁字母(Basic Latin),又称C0控制字符及基本拉丁字母(C0 Controls and Basic Latin),是Unicode标准下的首个Unicode区段,亦是唯一一个在UTF-8下,以单一字节编码的区段。此区段包含ASCII编码下所有字母与控制字符。该区段的范围为U+0000..U+007F(共128个字符),包含C0控制字符、ASCII标点符号与规约符号、ASCII数字、英文字母中的大写与小写字母,以及一个控制字符。
基本拉丁字母区段内的字符Unicode标准的1.0版本起一直沿用至今,多年来未曾对此作出任何增减。[3]该区段在1.0版本的名称为ASCII。[4]
字符表
下表列出基本拉丁字母包含的所有字符[5]:
|
|
|
|
子标题
“C0控制字符及基本拉丁字母”区段内包含六个子标题。[5]
“C0控制字符”(C0 Controls,于1.0版本中称为C0 ASCII控制符)乃继承自ASCII及其他7位元及8位编码系统。C0控制字符的别名乃基于ISO/IEC 6429:1992标准而取。[5]
“ASCII数字”(ASCII Digits)子标题包含标准欧式数字字符1-9及0。[5]
“大写拉丁字母”(Uppercase Latin alphabet)子标题包含26个标准、无附加符号的大写拉丁字母。[5]
“小写拉丁字母”(Lowercase Latin alphabet)子标题包含26个标准、无附加符号的小写拉丁字母。[5]
“控制字符”(Control Character)子标题仅包含“删除”字符。[5]
符号、字母与控制符数量
下表列出C0控制字符及基本拉丁字母区段中,各子标题的字母、符号与控制符数量。
子标题名称 | 符号数量 | 字符代码范围 |
---|---|---|
C0控制字符 | 32个控制字符 | U+0000..U+001F |
ASCII标点及符号 | 33个标点符号与符号 | U+0020..U+002F、U+003A..U+0040、U+005B..U+0060及U+007B..U+007E |
ASCII数字 | 10个数字 | U+0030..U+0039 |
大写拉丁字母 | 26个无附加符号的大写拉丁字母 | U+0041..U+005A |
小写拉丁字母 | 26个无附加符号的小写拉丁字母 | U+0061..U+007A |
控制字符 | 1个包含“删除”字符的控制字符 | U+007F |
区块
变体
历史
参见
注释
参考资料
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.