合字、連字、連結字或合體字(英語:Ligature),在西方字型排印學中一般表示將多於一個字母的合成一個字形。如印刷品中常常將拉丁字母兩個字母fi的i上一點常與f的一鈎合併,而德語字母ß原為ss等等。漢字的合字在不同情況下也稱作合文或合體字。
合字經過演變、長時間流行後,可能被視為直接的符號、文字而非合字。如W源自VV或UU,Æ源自AE,而表示「與」的意思的「&」,原是e和t的合字。
歷史
印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥德體中,帶右圈的字母(b, o,和p)和帶左圈的字母(c, e, o, d, g和q)的圈部都被重疊書寫。很多手寫本字元如h, m和n的豎劃都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。
當活字印刷誕生後,很多合字直接被製造成了鉛字。但是在1950年代無襯線字型廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版(之後激光印表機)之一的是高德納的TeX程式(詳見下文)。這一潮流也影響到了1985年之後的桌面排版技術。早期電腦軟件無法進行合字替換(但TeX可以),大部分新製作的電腦字型裏也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。
隨着現代電腦處理的多語言化和現代電子排版技術(如OpenType)的流行,合字開始逐漸恢復被使用。
拉丁文字
許多合字都把字母f和其後的字元組合起來,最常用的就是fi(或fi,顯示為兩個獨立字元)。很多字型的這兩個字母並排在一起後,字母i上的點會抵擋到字母f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把i的點融入f的勾來直接使用。其他f合字包括fj、[1]fl(fl)、ff(ff)、ffi(ffi)、和ffl(ffl)。其他合字包括fa、fe、fo、fr、fs、ft、fb、fh、fu、fy,以及f後加句號、逗號或連字元,還有不太常用的雙寫ff和fft。
使用這些合字是因為通常的小寫字母f中弧形勾影響字元間距調整。
有時,跨詞合字(如shelfful[2]的ff)是不希望出現的,電腦程式(如TeX)提供手動方式將它們分開。一些字型帶有fff合字(如Requiem體甚至包括一個 fffl合字)用於德語的複合詞,如Sauerstoffflasche(氧氣罐)和Schifffahrt(遊艇)(僅在遵循1996年拼寫改革法的前提下才寫作fff)。正式的德文正寫法,如杜登詞典所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如(Schiff-fahrt、Sauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的。[3]英語中類似的例子則是Shelfful。
土耳其語中有帶點和不帶點的字母I,如單詞fırın(烤箱)和fikir(主意)。fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。
合字ſʒ(sz)和tʒ(tz)來自德語哥德體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。
有時st(st)、ſt(ſt)、ch、ct、Qu以及Th的合字也被使用(如字型Linux Libertine)。
德語中eszett合字(亦稱scharfes S「清S」)ß,其名稱es-zett(意為「S-Z」)表示其源自「長S加Z」或「長S在圓S之上」。儘管「長s」ſ已經在現代德文正寫法消失了,ß仍被保留並被視為合字,傳統上在大寫的時候以及字母排序的時候覆寫為「SS」。2008年其大寫字母「ẞ」加入Unicode並出現更多字形。ß僅在德國和奧地利使用,瑞士德文不用這個合字。
字母W是7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Ƿ(Wynn),但受到諾曼人影響後廢棄不用。14世紀,這個起源於雙寫的V或U的「新」字母W誕生並在字母表中佔有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾斯語、馬耳他語和瓦龍語)使用它來拼寫本土詞彙。
字元Æ(小寫æ,中世紀時稱為aesc)作為一個字元在丹麥語、挪威語、冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個元音,且在字母表中有位置。現代英文正寫法中Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞encyclopædia也可拼寫成encyclopaedia或encyclopedia。
Æ源自中世紀拉丁文,當時只是一些詞彙的隨意合字如Æneas。它還可以在英文和法文中出現,但是現在已經傾向把A和E分開印刷。[4]同樣,Œ和œ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。
在德文正寫法中,帶兩點的字母元音ä、ö和ü來自歷史上的ae、oe、ue合字(嚴格的說是標在頂端的e,即aͤ,oͤ,uͤ)。現在當文書處理無法顯示這三個字元的情況下仍可覆寫為二合字母ae、oe、ue。字母排序中它們不等價於ae、oe、ue,而是被簡單看成a、o、u。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。
一些元音中的圈形附加符號,如å起源於一個o合字[5]。現在把舊式aa覆寫為å已經稱為不成文習慣,但在此之前也可寫成a上再加一個小a(aͣ),如Johannes Bureus、Runa ABC boken[6]。
uo合字ů的使用實例也在早期現代高地德語裏找到,但其後來混同到u中(如中期高地德語的fuosz、早期現代高地德語fuͦß、現代德語Fuß)。它仍存在於捷克語中,被稱為kroužek。
西班牙語和葡萄牙語中的上波浪線,分別用於字母ñ表示元音鼻音化,起源於一個nn合字[7](Espanna = España、anno = año)。同樣法語中的抑揚符也源自不發音s。[8]法語、葡萄牙語、西班牙語等中的字母ç其實是一個字母c蓋在一個z上面的形式。
字母ƕ(Hwair)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母hv用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。
拜占庭帝國有一個獨特的合字Ȣ(o-u合字),它源於希臘字母的ο-υ兩個字母的合字,並被加入到了字母表中。
ƣ(Gha)是一個罕見的字母,起源於Q和G,但在ISO的檔案中誤注成O-I合字(參見Unicode註解)。
國際音標使用合字來表示塞擦音,其中6個有Unicode編碼:ʣ、ʤ、ʥ、ʦ、ʧ、ʨ。一個擦音仍使用合字:ɮ,而國際音標擴充裏加入了另外三個:ʩ、ʪ、ʫ。
還有一些罕見合字,如Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ。
最常用的合字符號當屬&。它起源於E和t的合字,即拉丁文的單詞「和」(et)。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。
和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作and而不是et,而&c念作et cetera(等等)。大多數字型中的字形和兩字直接組合不一樣,但仍有一些字型(如Trebuchet MS)就把&設計為合字。
同樣,美元符號$可能也起源於合字(「pesos」,但有也有其他不同說法),但現在實際上已經被當成一個普通符號。[9]西班牙比塞塔(peseta)也有時被寫作合字₧(源自Pts)。
二合字母,如西班牙語和威爾斯語中的ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母ch和ll已經被考慮為分開的兩個字母。
法文的情況也一樣,œu被看成為合字œ與字母u的組合。
儘管如此,荷蘭語中「ij」的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字型中,通常是有一個獨立字形也有合字(如Zapfino)。無襯線字型大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的ij,和大寫字母IJ(同樣沒有點)看起來只是大小差異而已。而Y在本土荷蘭語詞彙中不被使用。
非拉丁字元
合字不僅出現在拉丁文字中:
- 婆羅米系文字的元音附標文字頻繁使用合字標註輔音。合字的數量依據語言而不同,如同樣的天城文,用於梵文的合字就要比印地文多。總數為37的輔音中,在天城文兩個字母組成的合字總數為1369,很少字型能全部顯示這些合字。微軟Windows系統附帶的Mangal等字型帶有印地語支援,但不能正確處理在द, ट, ठ, ड,和ढ右邊的輔音合字,而只是加怛達點畵後按照一般形式顯示在輔音之後。
- 希臘字母中使用一些合字,特別是在Ο(Omicron)和Υ(Upsilon)連寫並衍生出一個西里爾字母。參見Ȣ字母。
- 西里爾合字:Љ、Њ、Ы、Ѿ。Iotified西里爾字母是早期西里爾字母І和其他元音的合字:Ꙗ(Я的前身)、Ѥ、Ѩ、Ѭ、Ю(源自另外一個合字Ѹ,У的早期形式)。塞爾維亞語字母表中的兩個字母 Љ和Њ 在19世紀曾分別是Л、Н與軟音符號(ь)的合字。還有一個Я和Е的合字:Ԙԙ,其他合字包括Ꚅ、ꚅ 和 Ꚉ、ꚉ。
- 格拉哥里字母的一些手寫形式:用於中世紀到19世紀書寫的斯拉夫人語言,多為方形且常用合字。
- 在希伯來語中字母א(Aleph)和ל(Lamed)在一些前現代文字中(主要是宗教或「猶太-阿拉伯」文字)可組合為合字。該組合很常用,因為[ʔ][a]l-(在希伯來文中寫作aleph加lamed)是阿拉伯語中的定冠詞。
- 阿拉伯文:各個字母在詞頭,詞中,詞尾均有不同形式。如阿拉伯文的mīm,單獨書寫為م,三個連寫(mmm,顯示為詞頭,詞中,詞尾形)就變為ممم。注意lām + ʼalif的情況是特殊的:ﻻ,lām + ʼalif在詞中、詞尾形式是ﻼ。在Unicode有幾個特殊的合字,如安拉位於U+FDF2:ﷲ;太斯米位於U+FDFD:﷽ 等。
- 烏爾都語使用阿拉伯文字納斯塔里格體的手寫體,在電子排印中有大量合字。烏爾都語最常用的排版工具InPage使用納斯塔里格體字型產生多達20,000個合字。
- 藏文在Unicode有一個特殊的合字U+0F00:ༀ(唵)。
- 日文自江戶時代起便有以把文字組合在一起形成文字繪的遊戲,例子有へのへのもへじ。
- 漢字中如孔孟好學()、招財進寶()[10][11]、日進斗金、雙喜傳統上經常會合為一字書寫,稱為合文,另外還有大量疊字流傳至今。近年,也有網民將「草泥馬」「成龍」等字編成合文。
電腦排版
TeX是電腦排版系統中能使用合字的典型程式。它能提供五個常用合字:ff、fi、fl、ffi和ffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。
OpenType字型格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟件支援。XǝTeX就是一個可以運用這一優勢的TeX排版引擎。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文OpenType字型。OpenType中,這些是標準liga
、歷史性hlig
、上下文clig
、需求性rlig
和任意性dlig
合字。這些在CSS3中可用font-feature-settings
啟用或禁用。[12]
CSS還支援font-variant-ligatures
特效。common-ligatures
、discretionary-ligatures
、historical-ligatures
和contextual
特效也被支援。[13]
下表列出了常用文字對的合字以及Unicode代碼。正確顯示需要使用能正確處理合字的作業系統和瀏覽器並呼叫正確的Unicode 電腦字型。
Unicode中對合字的處理不是一個字元定義,而是一種繪製形式。即Unicode不把合字當作一個字元,而是把合字處理為字元序列,由字形繪製系統去處理是否用合字的字形在螢幕上顯示或者列印。比如,如果一個現代字型需要顯示h後加r,且該字型確實有hr合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是「不鼓勵」且「在任何環境下不會被再度編碼」的。[14]注意,合字æ和œ不能隨意替代ae和oe,比如does不能寫作dœs。
- 這是一個不完整列表。U+A732到U+A73D區域及其臨近區域的一些字元沒有列出。
非合字 | 合字 | Unicode | HTML |
---|---|---|---|
et | & | U+0026 | & |
ſs、ſz | ẞ、ß | U+1E9E、U+00DF | ẞ、ß |
AE、ae | Æ、æ | U+00C6、U+00E6 | Æ æ |
OE、oe | Œ、œ | U+0152、U+0153 | Œ œ |
IJ、ij | IJ、ij | U+0132、U+0133 | IJ ij |
ue | ᵫ | U+1D6B | ᵫ |
TZ、tz | Ꜩ、ꜩ | U+A728、U+A729 | Ꜩ ꜩ |
AA、aa | Ꜳ、ꜳ | U+A732、U+A733 | Ꜳ ꜳ |
AO、ao | Ꜵ、ꜵ | U+A734、U+A735 | Ꜵ ꜵ |
AU、au | Ꜷ、ꜷ | U+A736、U+A737 | Ꜷ ꜷ |
AV、av | Ꜹ、ꜹ | U+A738、U+A739 | Ꜹ ꜹ |
AY、ay | Ꜽ、ꜽ | U+A73C、U+A73D | Ꜽ ꜽ |
OO、oo | Ꝏ、ꝏ | U+A74E、U+A74F | Ꝏ ꝏ |
ui | ꭐ | U+AB50 | ꭐ |
ff | ff | U+FB00 | ff |
fi | fi | U+FB01 | fi |
fl | fl | U+FB02 | fl |
ffi | ffi | U+FB03 | ffi |
ffl | ffl | U+FB04 | ffl |
ſt | ſt | U+FB05 | ſt |
st | st | U+FB06 | st |
eT | 🙰 | U+1F670 | 🙰 |
另外,Dz、克羅地亞語和波斯尼亞語字母DŽ、LJ和NJ都有單獨的碼位。它們不是合字而是二合字母。
- 僅在標音時使用的合字
U+0238和U+0239是二合字母,但實際上是合字。[15]
- 計量單位的合字
- 除個別符號外絕大多數編成合字形式的計量單位的符號收錄於CJK Compatibility(U+3300到U+33FF)區域中
非合字 | 合字 | Unicode | HTML |
---|---|---|---|
°C | ℃ | U+2103 | ℃ |
°F | ℉ | U+2109 | ℉ |
fm | ㎙ | U+3399 | ㎙ |
nm | ㎚ | U+339A | ㎚ |
μm | ㎛ | U+339B | ㎛ |
mm | ㎜ | U+339C | ㎜ |
cm | ㎝ | U+339D | ㎝ |
dm | ㍷ | U+3377 | ㍷ |
km、KM | ㎞、㏎ | U+339E、U+33CE | ㎞ ㏎ |
μg | ㎍ | U+338D | ㎍ |
mg | ㎎ | U+338E | ㎎ |
kg | ㎏ | U+338F | ㎏ |
cal | ㎈ | U+3388 | ㎈ |
kcal | ㎉ | U+3389 | ㎉ |
μl | ㎕ | U+3395 | ㎕ |
ml | ㎖ | U+3396 | ㎖ |
dl | ㎗ | U+3397 | ㎗ |
kl | ㎘ | U+3398 | ㎘ |
Pa | ㎩ | U+33A9 | ㎩ |
kPa | ㎪ | U+33AA | ㎪ |
mPa | ㎫ | U+33AB | ㎫ |
GPa | ㎬ | U+33AC | ㎬ |
pA | ㎀ | U+3380 | ㎀ |
nA | ㎁ | U+3381 | ㎁ |
μA | ㎂ | U+3382 | ㎂ |
mA | ㎃ | U+3383 | ㎃ |
kA | ㎄ | U+3384 | ㎄ |
pV | ㎴ | U+33B4 | ㎴ |
nV | ㎵ | U+33B5 | ㎵ |
μV | ㎶ | U+33B6 | ㎶ |
mV、MV | ㎷、㎹ | U+33B7、U+33B9 | ㎷ ㎹ |
kV | ㎸ | U+33B8 | ㎸ |
pW | ㎺ | U+33BA | ㎺ |
nW | ㎻ | U+33BB | ㎻ |
μW | ㎼ | U+33BC | ㎼ |
mW、MW | ㎽、㎿ | U+33BD、U+33BF | ㎽ ㎿ |
kW | ㎾ | U+33BE | ㎾ |
kΩ | ㏀ | U+33C0 | ㏁ |
MΩ | ㏁ | U+33C1 | ㏂ |
Hz | ㎐ | U+3390 | ㎏ |
kHz | ㎑ | U+3391 | ㎐ |
MHz | ㎒ | U+3392 | ㎑ |
GHz | ㎓ | U+3393 | ㎒ |
THz | ㎔ | U+3394 | ㎓ |
KB | ㎅ | U+3385 | ㎅ |
MB | ㎆ | U+3386 | ㎆ |
GB | ㎇ | U+3387 | ㎇ |
lm | ㏐ | U+33D0 | ㏐ |
ln | ㏑ | U+33D1 | ㏑ |
lx | ㏓ | U+33D3 | ㏓ |
mol | ㏖ | U+33D6 | ㏖ |
rad | ㎭ | U+33AD | ㎭ |
rad/s | ㎮ | U+33AE | ㎮ |
ps | ㎰ | U+33B0 | ㎰ |
ns | ㎱ | U+33B1 | ㎱ |
μs | ㎲ | U+33B2 | ㎲ |
ms | ㎳ | U+33B3 | ㎳ |
註釋
參閲
外部連結
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.