基本拉丁字母(Basic Latin),又称C0控制字符及基本拉丁字母(C0 Controls and Basic Latin),是Unicode标准下的首个Unicode区段,亦是唯一一个在UTF-8下,以单一字节编码的区段。此区段包含ASCII编码下所有字母与控制字符。该区段的范围为U+0000..U+007F(共128个字符),包含C0控制字符、ASCII标点符号与规约符号、ASCII数字、英文字母中的大写与小写字母,以及一个控制字符。
Quick Facts C0控制字符及基本拉丁字母 C0 Controls and Basic Latin, 范围 ...
Close
基本拉丁字母区段内的字符Unicode标准的1.0版本起一直沿用至今,多年来未曾对此作出任何增减。[3]该区段在1.0版本的名称为ASCII。[4]
下表列出基本拉丁字母包含的所有字符[5]:
More information 码位, 显示 ...
Close
字符表
- A 字符U+005C(\)在日/韩语字体中或会显示成日元(¥)或韩圜符号(₩),皆因这些字体错误地视Unicode(尤其是UTF-8)为一款传统字符集,并将反斜线取代成这些符号。[6]
“C0控制字符及基本拉丁字母”区段内包含六个子标题。[5]
“C0控制字符”(C0 Controls,于1.0版本中称为)乃继承自ASCII及其他7位元及8位编码系统。C0控制字符的别名乃基于ISO/IEC 6429:1992标准而取。[5]
此子标题乃指针准标点字符、简单数学运算符,以及比索符号($)、百分号、&符号、下划线和管道符号等符号。[5]
“ASCII数字”(ASCII Digits)子标题包含标准欧式数字字符1-9及0。[5]
“大写拉丁字母”(Uppercase Latin alphabet)子标题包含26个标准、无附加符号的大写拉丁字母。[5]
“小写拉丁字母”(Lowercase Latin alphabet)子标题包含26个标准、无附加符号的小写拉丁字母。[5]
“控制字符”(Control Character)子标题仅包含“删除”字符。[5]
下表列出C0控制字符及基本拉丁字母区段中,各子标题的字母、符号与控制符数量。
More information 子标题名称, 符号数量 ...
子标题名称
|
符号数量
|
字符代码范围
|
C0控制字符
|
32个控制字符
|
U+0000..U+001F
|
ASCII标点及符号
|
33个标点符号与符号
|
U+0020..U+002F、U+003A..U+0040、U+005B..U+0060及U+007B..U+007E
|
ASCII数字
|
10个数字
|
U+0030..U+0039
|
大写拉丁字母
|
26个无附加符号的大写拉丁字母
|
U+0041..U+005A
|
小写拉丁字母
|
26个无附加符号的小写拉丁字母
|
U+0061..U+007A
|
控制字符
|
1个包含“删除”字符的控制字符
|
U+007F
|
Close
C0控制字符和基本拉丁字母 C0 Controls and Basic Latin[a] Unicode Consortium 官方码表 (PDF)
|
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
A |
B |
C |
D |
E |
F
|
U+000x
|
NUL
|
SOH
|
STX
|
ETX
|
EOT
|
ENQ
|
ACK
|
BEL
|
BS
|
HT
|
LF
|
VT
|
FF
|
CR
|
SO
|
SI
|
U+001x
|
DLE
|
DC1
|
DC2
|
DC3
|
DC4
|
NAK
|
SYN
|
ETB
|
CAN
|
EM
|
SUB
|
ESC
|
FS
|
GS
|
RS
|
US
|
U+002x
|
SP
|
!
|
"
|
#
|
$
|
%
|
&
|
'
|
(
|
)
|
*
|
+
|
,
|
-
|
.
|
/
|
U+003x
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
:
|
;
|
<
|
=
|
>
|
?
|
U+004x
|
@
|
A
|
B
|
C
|
D
|
E
|
F
|
G
|
H
|
I
|
J
|
K
|
L
|
M
|
N
|
O
|
U+005x
|
P
|
Q
|
R
|
S
|
T
|
U
|
V
|
W
|
X
|
Y
|
Z
|
[
|
\
|
]
|
^
|
_
|
U+006x
|
`
|
a
|
b
|
c
|
d
|
e
|
f
|
g
|
h
|
i
|
j
|
k
|
l
|
m
|
n
|
o
|
U+007x
|
p
|
q
|
r
|
s
|
t
|
u
|
v
|
w
|
x
|
y
|
z
|
{
|
|
|
}
|
~
|
DEL
|
|
部分字符若跟从变体指示器(variant indicators),则会以标准化变体的定义生成。
区段内亦有一个为字符“0”定义、带有短对角斜线的变体0︀(U+0030 DIGIT ZERO U+FE00 VS1)。[7][8]
12个字符可透过U+FE0E VS15或U+FE0F VS16以生成绘文字变体。[9][10][11][12]它们均为键帽基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是“文字样式”,而VS16版本则为“绘文字样式”。[8]
绘文字可选变体
U+
|
0023
|
002A
|
0030
|
0031
|
0032
|
0033
|
0034
|
0035
|
0036
|
0037
|
0038
|
0039
|
基本码位
|
#
|
*
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
基本+VS15+键帽
|
#︎⃣
|
*︎⃣
|
0︎⃣
|
1︎⃣
|
2︎⃣
|
3︎⃣
|
4︎⃣
|
5︎⃣
|
6︎⃣
|
7︎⃣
|
8︎⃣
|
9︎⃣
|
基本+VS16+键帽
|
#️⃣
|
*️⃣
|
0️⃣
|
1️⃣
|
2️⃣
|
3️⃣
|
4️⃣
|
5️⃣
|
6️⃣
|
7️⃣
|
8️⃣
|
9️⃣
|
以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程:
More information 版本, 最终码位[a] ...
版本
|
最终码位[a]
|
码位数
|
UTC ID
|
L2 ID
|
WG2 ID
|
文档
|
1.0.0
|
U+0000..007F
|
128
|
|
|
|
(待查)
|
UTC/1999-013
|
|
|
Karlsson, Kent, Tildes and micro sign decompositions, 1999-05-27
|
|
L2/99-176R
|
|
Moore, Lisa, Minutes from the joint UTC/L2 meeting in Seattle, June 8-10, 1999, 1999-11-04
|
|
L2/04-145
|
|
Starner, David, C with stroke character examples from BAE report 1884 (Dorsey), 2004-04-30
|
|
L2/04-202
|
|
Anderson, Deborah, Slashed C Feedback, 2004-06-07
|
|
|
N3046 (页面存档备份,存于互联网档案馆)
|
Suignard, Michel, Improving formal definition for control characters, 2006-02-22
|
|
|
N3103 (pdf, doc (页面存档备份,存于互联网档案馆))
|
Umamaheswaran, V. S., Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27, 2006-08-25
|
|
L2/11-043
|
|
Freytag, Asmus; Karlsson, Kent, Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters, 2011-02-02
|
|
L2/11-160
|
|
PRI #181 Changing General Category of Twelve Characters, 2011-05-02
|
|
L2/11-261R2
|
|
Moore, Lisa, UTC #128 / L2 #225 Minutes, 2011-08-16, Accept Ken Whistler's recommendations in L2/11-281 on name aliases for control characters with the addition of the abbreviations BEL and NUL.
|
|
L2/11-438[b][c]
|
N4182 (页面存档备份,存于互联网档案馆)
|
Edberg, Peter, Emoji Variation Sequences (Revision of L2/11-429), 2011-12-22
|
|
L2/15-107
|
|
Moore, Lisa, UTC #143 Minutes, 2015-05-12, Add the 12 keycap sequences in emoji-data.txt as provisional named sequences in Unicode 8.0.
|
|
L2/15-268
|
|
Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray, Proposal to Represent the Slashed Zero Variant of Empty Set, 2015-10-30
|
|
L2/15-301[d][c]
|
|
Pournader, Roozbeh, A proposal for 278 standardized variation sequences for emoji, 2015-11-01
|
|
L2/15-254
|
|
Moore, Lisa, UTC #145 Minutes, 2015-11-16
|
|
L2/17-294
|
N4914 (页面存档备份,存于互联网档案馆)
|
Lunde, Ken, Proposal to add standardized variation sequence for U+FF10 FULLWIDTH DIGIT ZERO, 2017-08-14
|
参阅“杂项符号和象形文字”区段的历史一节以查看与绘文字有关的额外文件
|
Close
The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.