空格 是行文为防止混淆或有特定用途的空位。古代中文在书写上一般不用标点 [ 1] ,字与字之间亦无空格。空格通常作特定用途,如每段 起首须缩入两个字位[ 2] ,尊称 前要留空一格作挪抬 等等。
欧洲语言
Quick Facts 一般标点符号, 分字符 ...
Close
在拉丁语族 和日耳曼语族 的语言中,字与字之间以及标点符号 与其后的字之间会以空格作间隔。在句号 后面,一般以一个空格与其后的字分隔,这种分隔称为“法式分隔”。[ 3] 有时候在处理文书上,会在句号后以两个空格作间隔,这种分隔称为“英式分隔”。
东亚语言
在东亚语言里,空格运用的程度有异。中文 、日文 比较少在文书上使用空格,而日文 会在正式场合里在人名 上运用空格,以分隔姓氏 与名字 。在韩文 ,书写的时候运用大量的空格,称为“隔写法”(韩文 :띄어쓰기)。韩文的隔写法有标点符号的作用。比如说“아버지가방에들어가신다.”这个句子会因不同的隔写方式,而有不同的意思:
아버지가 방에 들어가신다.(爸爸进房间去了。)
아버지 가방에 들어가신다.(爸爸进提包里去了。)
中文排版
在使用中文电脑初期,文字处理及网页编辑工具大多改自英文软件,与BIG5 编码并不完全兼容;英文ASCII 字符编码为1byte 、中文BIG5则是2byte,假使边界或断行排版 没设置好,不足容纳中文字时会造成该字或整段乱码,因此比照英文排版在各字间加半角空格(多出1byte缓冲)以避开程序错误 。
及至中文文书和网页编辑软件发展成熟后,不再产生乱码情形,也就无须在字间加空格。少数香港媒体新闻网页直到2010年代初,如香港电台 当时还维持早期排版方式[ 4] 。
Unicode定义
Unicode中的各种空格
Unicode 定义了大量空格符号,列表如下:
More information 编码, 不换行 ...
Unicode定义之空格字符
编码
不换行
用于URL
HTML
名称
区域
显示
U+0009
文字制表符(Character Tabulation)
基本拉丁文
同ASCII 字符0x09
U+0020
空格
基本拉丁文
普通半角 空格,同ASCII 字符0x20
U+00A0
✓
不换行空格 (No-Break Space)
Latin-1 Supplement
同U+0020,但不换行
U+1680
✓
欧甘空格(Ogham Space Mark)
欧甘字母
用于分隔欧甘文 单词。通常情况下显示为一条直线,而在没有字干的字体中会显示成空格。需要欧甘文字体。
U+180E
✓
蒙古文元音分隔符(Mongolian Vowel Separator,MVS)
蒙古文
作用近似不换行空格,用于蒙古文时使得词尾两个字母呈现不同的字形。自Unicode 6.3.0起不再定义为空格。
U+2002
 
En空格(En Space)或Nut
通用标点
与en 同宽(em 之一半)。
U+2003
 
Em空格(Em Space)或Mutton
通用标点
与em同宽。
U+2004
 
Em三分之一空格(Three-Per-Em Space)或Thick Space
通用标点
em之三分之一宽
U+2005
 
Em四分之一空格(Four-Per-Em Space)或Mid Space
通用标点
em之四分之一宽
U+2006
Em六分之一空格(Six-Per-Em Space)
通用标点
em之六分之一宽。电脑字体有时与U+2009等同。
U+2007
✓
 
数字 空格(Figure Space)
通用标点
用于分隔数字之定位符,与单一数字同宽
U+2008
标点空格
通用标点
与同字体之窄标点同宽,即句号或逗号(西方语文)之宽度[ 5]
U+2009
 
窄空格(Thin Space)
通用标点
em之六分之一(有时设计成五分之一)宽。建议用作SI单位 数字之千位分隔符 。与U+2002至U+2008不同,其宽可根据排版调整[ 6]
U+200A
发宽空格(Hair Space)
通用标点
窄于窄空格(thin space)
U+200B
零宽空格 (Zero Width Space,简称“ZWSP”)
通用标点
U+200C
✓
‌
零宽不连字 (Zero Width Non Joiner,简称“ZWNJ”)
通用标点
U+200D
✓
‍
零宽连字 (Zero Width Joiner,简称“ZWJ”)
通用标点
U+202F
✓
窄式不换行空格(Narrow No-Break Space)
通用标点
作用近似U+00A0不换行空格。用于蒙古文时宽度通常为普通空格三分之一,用于其他文字时宽度有时相当于U+2009窄空格。
U+205F
中数学空格(Medium Mathematical Space,简称“MMSP”)
通用标点
用于数学方程式。em之18分之4宽[ 7] 在数学排版领域,空格宽度通常以十八份之几的方式给定;4/18 em可用于数个情况,例如数式a + b 中a 与 + 及 + 与b 之间[ 8]
U+2060
✓
✓
文字连接符(Word Joiner)
通用标点
同U+200B,但该处不能换行。Unicode 3.2新增,以代替U+FEFF字符废止之零宽不换行空格功能
U+3000
表意文字空格
CJK 符号及标点
与CJK文字同宽(全角 )
U+FEFF
✓
✓
零宽不换行空格 (Zero Width No-Break Space) = 字节顺序记号 (Byte Order Mark,简称“BOM”)
Arabic Presentation Forms-B
主要用作字节次序标记字符。原来之不换行指示功能于Unicode 3.2起废止,代之以U+2060。
Close
Unicode在控制图形 (Control Pictures)区域亦提供一些具像字符用来代表空格,例如␠
(Symbol For Space,U+2420)、␢
(Blank Symbol,U+2422)和␣
(Open Box,U+2423)[ 9] 。有些文字处理软件如Microsoft Word 会使用间隔号 ·
代表半角空格。
注释
Einsohn, Amy. Punctuation, Eyeballing every mark . The Copyeditor's Handbook: A Guide for Book Publishing and Corporate Communications 2nd. Berkeley, Los Angeles, London: University of California Press. 2006: 113 [2010-04-25 ] . ISBN 9780520246881 . If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon ...
The Unicode Standard 5.0, printed edition, p.205
延伸阅读
另见