Loading AI tools
一般表示將多於一個字母的合成一個字形 来自维基百科,自由的百科全书
合字、連字、連結字或合體字(英語:Ligature),在西方字型排印學中一般表示將多於一個字母的合成一個字形。如印刷品中常常將拉丁字母兩個字母fi的i上一點常與f的一鈎合併,而德語字母ß原為ss等等。漢字的合字在不同情況下也稱作合文或合體字。
合字經過演變、長時間流行後,可能被視為直接的符號、文字而非合字。如W源自VV或UU,Æ源自AE,而表示「與」的意思的「&」,原是e和t的合字。
印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥德體中,帶右圈的字母(b, o,和p)和帶左圈的字母(c, e, o, d, g和q)的圈部都被重疊書寫。很多手寫本字元如h, m和n的豎劃都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。
當活字印刷誕生後,很多合字直接被製造成了鉛字。但是在1950年代無襯線字型廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版(之後激光印表機)之一的是高德納的TeX程式(詳見下文)。這一潮流也影響到了1985年之後的桌面排版技術。早期電腦軟件無法進行合字替換(但TeX可以),大部分新製作的電腦字型裏也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。
隨着現代電腦處理的多語言化和現代電子排版技術(如OpenType)的流行,合字開始逐漸恢復被使用。
許多合字都把字母f和其後的字元組合起來,最常用的就是fi(或fi,顯示為兩個獨立字元)。很多字型的這兩個字母並排在一起後,字母i上的點會抵擋到字母f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把i的點融入f的勾來直接使用。其他f合字包括fj、[1]fl(fl)、ff(ff)、ffi(ffi)、和ffl(ffl)。其他合字包括fa、fe、fo、fr、fs、ft、fb、fh、fu、fy,以及f後加句號、逗號或連字元,還有不太常用的雙寫ff和fft。
使用這些合字是因為通常的小寫字母f中弧形勾影響字元間距調整。
有時,跨詞合字(如shelfful[2]的ff)是不希望出現的,電腦程式(如TeX)提供手動方式將它們分開。一些字型帶有fff合字(如Requiem體甚至包括一個 fffl合字)用於德語的複合詞,如Sauerstoffflasche(氧氣罐)和Schifffahrt(遊艇)(僅在遵循1996年拼寫改革法的前提下才寫作fff)。正式的德文正寫法,如杜登詞典所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如(Schiff-fahrt、Sauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的。[3]英語中類似的例子則是Shelfful。
土耳其語中有帶點和不帶點的字母I,如單詞fırın(烤箱)和fikir(主意)。fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。
合字ſʒ(sz)和tʒ(tz)來自德語哥德體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。
有時st(st)、ſt(ſt)、ch、ct、Qu以及Th的合字也被使用(如字型Linux Libertine)。
德語中eszett合字(亦稱scharfes S「清S」)ß,其名稱es-zett(意為「S-Z」)表示其源自「長S加Z」或「長S在圓S之上」。儘管「長s」ſ已經在現代德文正寫法消失了,ß仍被保留並被視為合字,傳統上在大寫的時候以及字母排序的時候覆寫為「SS」。2008年其大寫字母「ẞ」加入Unicode並出現更多字形。ß僅在德國和奧地利使用,瑞士德文不用這個合字。
字母W是7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Ƿ(Wynn),但受到諾曼人影響後廢棄不用。14世紀,這個起源於雙寫的V或U的「新」字母W誕生並在字母表中佔有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾斯語、馬耳他語和瓦龍語)使用它來拼寫本土詞彙。
字元Æ(小寫æ,中世紀時稱為aesc)作為一個字元在丹麥語、挪威語、冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個元音,且在字母表中有位置。現代英文正寫法中Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞encyclopædia也可拼寫成encyclopaedia或encyclopedia。
Æ源自中世紀拉丁文,當時只是一些詞彙的隨意合字如Æneas。它還可以在英文和法文中出現,但是現在已經傾向把A和E分開印刷。[4]同樣,Œ和œ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。
在德文正寫法中,帶兩點的字母元音ä、ö和ü來自歷史上的ae、oe、ue合字(嚴格的說是標在頂端的e,即aͤ,oͤ,uͤ)。現在當文書處理無法顯示這三個字元的情況下仍可覆寫為二合字母ae、oe、ue。字母排序中它們不等價於ae、oe、ue,而是被簡單看成a、o、u。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。
一些元音中的圈形附加符號,如å起源於一個o合字[5]。現在把舊式aa覆寫為å已經稱為不成文習慣,但在此之前也可寫成a上再加一個小a(aͣ),如Johannes Bureus、Runa ABC boken[6]。
uo合字ů的使用實例也在早期現代高地德語裏找到,但其後來混同到u中(如中期高地德語的fuosz、早期現代高地德語fuͦß、現代德語Fuß)。它仍存在於捷克語中,被稱為kroužek。
西班牙語和葡萄牙語中的上波浪線,分別用於字母ñ表示元音鼻音化,起源於一個nn合字[7](Espanna = España、anno = año)。同樣法語中的抑揚符也源自不發音s。[8]法語、葡萄牙語、西班牙語等中的字母ç其實是一個字母c蓋在一個z上面的形式。
字母ƕ(Hwair)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母hv用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。
拜占庭帝國有一個獨特的合字Ȣ(o-u合字),它源於希臘字母的ο-υ兩個字母的合字,並被加入到了字母表中。
ƣ(Gha)是一個罕見的字母,起源於Q和G,但在ISO的檔案中誤注成O-I合字(參見Unicode註解)。
國際音標使用合字來表示塞擦音,其中6個有Unicode編碼:ʣ、ʤ、ʥ、ʦ、ʧ、ʨ。一個擦音仍使用合字:ɮ,而國際音標擴充裏加入了另外三個:ʩ、ʪ、ʫ。
還有一些罕見合字,如Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ。
最常用的合字符號當屬&。它起源於E和t的合字,即拉丁文的單詞「和」(et)。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。
和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作and而不是et,而&c念作et cetera(等等)。大多數字型中的字形和兩字直接組合不一樣,但仍有一些字型(如Trebuchet MS)就把&設計為合字。
同樣,美元符號$可能也起源於合字(「pesos」,但有也有其他不同說法),但現在實際上已經被當成一個普通符號。[9]西班牙比塞塔(peseta)也有時被寫作合字₧(源自Pts)。
二合字母,如西班牙語和威爾斯語中的ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母ch和ll已經被考慮為分開的兩個字母。
法文的情況也一樣,œu被看成為合字œ與字母u的組合。
儘管如此,荷蘭語中「ij」的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字型中,通常是有一個獨立字形也有合字(如Zapfino)。無襯線字型大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的ij,和大寫字母IJ(同樣沒有點)看起來只是大小差異而已。而Y在本土荷蘭語詞彙中不被使用。
合字不僅出現在拉丁文字中:
TeX是電腦排版系統中能使用合字的典型程式。它能提供五個常用合字:ff、fi、fl、ffi和ffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。
OpenType字型格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟件支援。XǝTeX就是一個可以運用這一優勢的TeX排版引擎。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文OpenType字型。OpenType中,這些是標準liga
、歷史性hlig
、上下文clig
、需求性rlig
和任意性dlig
合字。這些在CSS3中可用font-feature-settings
啟用或禁用。[12]
CSS還支援font-variant-ligatures
特效。common-ligatures
、discretionary-ligatures
、historical-ligatures
和contextual
特效也被支援。[13]
下表列出了常用文字對的合字以及Unicode代碼。正確顯示需要使用能正確處理合字的作業系統和瀏覽器並呼叫正確的Unicode 電腦字型。
Unicode中對合字的處理不是一個字元定義,而是一種繪製形式。即Unicode不把合字當作一個字元,而是把合字處理為字元序列,由字形繪製系統去處理是否用合字的字形在螢幕上顯示或者列印。比如,如果一個現代字型需要顯示h後加r,且該字型確實有hr合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是「不鼓勵」且「在任何環境下不會被再度編碼」的。[14]注意,合字æ和œ不能隨意替代ae和oe,比如does不能寫作dœs。
非合字 | 合字 | Unicode | HTML |
---|---|---|---|
et | & | U+0026 | & |
ſs、ſz | ẞ、ß | U+1E9E、U+00DF | ẞ、ß |
AE、ae | Æ、æ | U+00C6、U+00E6 | Æ æ |
OE、oe | Œ、œ | U+0152、U+0153 | Œ œ |
IJ、ij | IJ、ij | U+0132、U+0133 | IJ ij |
ue | ᵫ | U+1D6B | ᵫ |
TZ、tz | Ꜩ、ꜩ | U+A728、U+A729 | Ꜩ ꜩ |
AA、aa | Ꜳ、ꜳ | U+A732、U+A733 | Ꜳ ꜳ |
AO、ao | Ꜵ、ꜵ | U+A734、U+A735 | Ꜵ ꜵ |
AU、au | Ꜷ、ꜷ | U+A736、U+A737 | Ꜷ ꜷ |
AV、av | Ꜹ、ꜹ | U+A738、U+A739 | Ꜹ ꜹ |
AY、ay | Ꜽ、ꜽ | U+A73C、U+A73D | Ꜽ ꜽ |
OO、oo | Ꝏ、ꝏ | U+A74E、U+A74F | Ꝏ ꝏ |
ui | ꭐ | U+AB50 | ꭐ |
ff | ff | U+FB00 | ff |
fi | fi | U+FB01 | fi |
fl | fl | U+FB02 | fl |
ffi | ffi | U+FB03 | ffi |
ffl | ffl | U+FB04 | ffl |
ſt | ſt | U+FB05 | ſt |
st | st | U+FB06 | st |
eT | 🙰 | U+1F670 | 🙰 |
另外,Dz、克羅地亞語和波斯尼亞語字母DŽ、LJ和NJ都有單獨的碼位。它們不是合字而是二合字母。
U+0238和U+0239是二合字母,但實際上是合字。[15]
非合字 | 合字 | Unicode | HTML |
---|---|---|---|
°C | ℃ | U+2103 | ℃ |
°F | ℉ | U+2109 | ℉ |
fm | ㎙ | U+3399 | ㎙ |
nm | ㎚ | U+339A | ㎚ |
μm | ㎛ | U+339B | ㎛ |
mm | ㎜ | U+339C | ㎜ |
cm | ㎝ | U+339D | ㎝ |
dm | ㍷ | U+3377 | ㍷ |
km、KM | ㎞、㏎ | U+339E、U+33CE | ㎞ ㏎ |
μg | ㎍ | U+338D | ㎍ |
mg | ㎎ | U+338E | ㎎ |
kg | ㎏ | U+338F | ㎏ |
cal | ㎈ | U+3388 | ㎈ |
kcal | ㎉ | U+3389 | ㎉ |
μl | ㎕ | U+3395 | ㎕ |
ml | ㎖ | U+3396 | ㎖ |
dl | ㎗ | U+3397 | ㎗ |
kl | ㎘ | U+3398 | ㎘ |
Pa | ㎩ | U+33A9 | ㎩ |
kPa | ㎪ | U+33AA | ㎪ |
mPa | ㎫ | U+33AB | ㎫ |
GPa | ㎬ | U+33AC | ㎬ |
pA | ㎀ | U+3380 | ㎀ |
nA | ㎁ | U+3381 | ㎁ |
μA | ㎂ | U+3382 | ㎂ |
mA | ㎃ | U+3383 | ㎃ |
kA | ㎄ | U+3384 | ㎄ |
pV | ㎴ | U+33B4 | ㎴ |
nV | ㎵ | U+33B5 | ㎵ |
μV | ㎶ | U+33B6 | ㎶ |
mV、MV | ㎷、㎹ | U+33B7、U+33B9 | ㎷ ㎹ |
kV | ㎸ | U+33B8 | ㎸ |
pW | ㎺ | U+33BA | ㎺ |
nW | ㎻ | U+33BB | ㎻ |
μW | ㎼ | U+33BC | ㎼ |
mW、MW | ㎽、㎿ | U+33BD、U+33BF | ㎽ ㎿ |
kW | ㎾ | U+33BE | ㎾ |
kΩ | ㏀ | U+33C0 | ㏁ |
MΩ | ㏁ | U+33C1 | ㏂ |
Hz | ㎐ | U+3390 | ㎏ |
kHz | ㎑ | U+3391 | ㎐ |
MHz | ㎒ | U+3392 | ㎑ |
GHz | ㎓ | U+3393 | ㎒ |
THz | ㎔ | U+3394 | ㎓ |
KB | ㎅ | U+3385 | ㎅ |
MB | ㎆ | U+3386 | ㎆ |
GB | ㎇ | U+3387 | ㎇ |
lm | ㏐ | U+33D0 | ㏐ |
ln | ㏑ | U+33D1 | ㏑ |
lx | ㏓ | U+33D3 | ㏓ |
mol | ㏖ | U+33D6 | ㏖ |
rad | ㎭ | U+33AD | ㎭ |
rad/s | ㎮ | U+33AE | ㎮ |
ps | ㎰ | U+33B0 | ㎰ |
ns | ㎱ | U+33B1 | ㎱ |
μs | ㎲ | U+33B2 | ㎲ |
ms | ㎳ | U+33B3 | ㎳ |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.