空格是行文為防止混淆或有特定用途的空位。古代中文在書寫上一般不用標點[1],字與字之間亦無空格。空格通常作特定用途,如每段起首須縮入兩個字位[2],尊稱前要留空一格作挪抬等等。
空格 | |
歐洲語言
在拉丁語族和日耳曼語族的語言中,字與字之間以及標點符號與其後的字之間會以空格作間隔。在句號後面,一般以一個空格與其後的字分隔,這種分隔稱為「法式分隔」。[3] 有時候在處理文書上,會在句號後以兩個空格作間隔,這種分隔稱為「英式分隔」。
東亞語言
在東亞語言裏,空格運用的程度有異。中文、日文比較少在文書上使用空格,而日文會在正式場合裏在人名上運用空格,以分隔姓氏與名字。在韓文,書寫的時候運用大量的空格,稱為「隔寫法」(韓文:띄어쓰기)。韓文的隔寫法有標點符號的作用。比如說「아버지가방에들어가신다.」這個句子會因不同的隔寫方式,而有不同的意思:
|
中文排版
在使用中文電腦初期,文書處理及網頁編輯工具大多改自英文軟件,與BIG5編碼並不完全相容;英文ASCII字元編碼為1byte、中文BIG5則是2byte,假使邊界或斷行排版沒設置好,不足容納中文字時會造成該字或整段亂碼,因此比照英文排版在各字間加半形空格(多出1byte緩衝)以避開程式錯誤。
及至中文文書和網頁編輯軟件發展成熟後,不再產生亂碼情形,也就無須在字間加空格。少數香港媒體新聞網頁直到2010年代初,如香港電台當時還維持早期排版方式[4]。
Unicode定義
Unicode定義了大量空格符號,列表如下:
編碼 | 不換行 | 用於URL | HTML | 名稱 | 區域 | 顯示 | |
---|---|---|---|---|---|---|---|
U+0009 | 文字制表符(Character Tabulation) | 基本拉丁文 | |||||
同ASCII字元0x09 | |||||||
U+0020 | 空格 | 基本拉丁文 | |||||
普通半形空格,同ASCII字元0x20 | |||||||
U+00A0 | ✓ | | 不換行空格(No-Break Space) | Latin-1 Supplement | |||
同U+0020,但不換行 | |||||||
U+1680 | ✓ | 歐甘空格(Ogham Space Mark) | 歐甘字母 | ||||
用於分隔歐甘文單詞。通常情況下顯示為一條直線,而在沒有字干的字型中會顯示成空格。需要歐甘文字型。 | |||||||
U+180E | ✓ | 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) | 蒙古文 | | |||
作用近似不換行空格,用於蒙古文時使得詞尾兩個字母呈現不同的字形。自Unicode 6.3.0起不再定義為空格。 | |||||||
U+2002 |   | En空格(En Space)或Nut | 通用標點 | ||||
與en同寬(em之一半)。 | |||||||
U+2003 |   | Em空格(Em Space)或Mutton | 通用標點 | ||||
與em同寬。 | |||||||
U+2004 |   | Em三分之一空格(Three-Per-Em Space)或Thick Space | 通用標點 | ||||
em之三分之一寬 | |||||||
U+2005 |   | Em四分之一空格(Four-Per-Em Space)或Mid Space | 通用標點 | ||||
em之四分之一寬 | |||||||
U+2006 | Em六分之一空格(Six-Per-Em Space) | 通用標點 | |||||
em之六分之一寬。電腦字型有時與U+2009等同。 | |||||||
U+2007 | ✓ |   | 數字空格(Figure Space) | 通用標點 | |||
用於分隔數字之定位符,與單一數字同寬 | |||||||
U+2008 | 標點空格 | 通用標點 | |||||
與同字型之窄標點同寬,即句號或逗號(西方語文)之寬度[5] | |||||||
U+2009 |   | 窄空格(Thin Space) | 通用標點 | ||||
em之六分之一(有時設計成五分之一)寬。建議用作SI單位數字之千位分隔符。與U+2002至U+2008不同,其寬可根據排版調整[6] | |||||||
U+200A | 髮寬空格(Hair Space) | 通用標點 | |||||
窄於窄空格(thin space) | |||||||
U+200B | 零寬空格(Zero Width Space,簡稱「ZWSP」) | 通用標點 | | ||||
U+200C | ✓ | ‌ | 零寬不連字(Zero Width Non Joiner,簡稱「ZWNJ」) | 通用標點 | | ||
U+200D | ✓ | ‍ | 零寬連字(Zero Width Joiner,簡稱「ZWJ」) | 通用標點 | | ||
U+202F | ✓ | 窄式不換行空格(Narrow No-Break Space) | 通用標點 | ||||
作用近似U+00A0不換行空格。用於蒙古文時寬度通常為普通空格三分之一,用於其他文字時寬度有時相當於U+2009窄空格。 | |||||||
U+205F | 中數學空格(Medium Mathematical Space,簡稱「MMSP」) | 通用標點 | |||||
用於數學方程式。em之18分之4寬[7]在數學排版領域,空格寬度通常以十八份之幾的方式給定;4/18 em可用於數個情況,例如數式a + b中a與 +及 +與b之間[8] | |||||||
U+2060 | ✓ | ✓ | 文字連接符(Word Joiner) | 通用標點 | | ||
同U+200B,但該處不能換行。Unicode 3.2新增,以代替U+FEFF字元廢止之零寬不換行空格功能 | |||||||
U+3000 | 表意文字空格 | CJK符號及標點 | |||||
與CJK文字同寬(全形) | |||||||
U+FEFF | ✓ | ✓ | 零寬不換行空格(Zero Width No-Break Space) = 位元組順序記號(Byte Order Mark,簡稱「BOM」) | Arabic Presentation Forms-B | | ||
主要用作位元組次序標記字元。原來之不換行指示功能於Unicode 3.2起廢止,代之以U+2060。 |
Unicode在控制圖形(Control Pictures)區域亦提供一些具像字元用來代表空格,例如␠
(Symbol For Space,U+2420)、␢
(Blank Symbol,U+2422)和␣
(Open Box,U+2423)[9]。有些文書處理軟件如Microsoft Word會使用間隔號·
代表半形空格。
註釋
延伸閲讀
另見
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.