组合字符
维基百科,自由的 encyclopedia
组合字符(Combining character)在字体排印学中是用来改变其它字符所用的字符。在拉丁字母中,最常见的组合字符为附加符号(包含重音号)。 [1]
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/4/4e/U_niesk%C5%82adovaje_Unicode.svg/320px-U_niesk%C5%82adovaje_Unicode.svg.png)
统一码也包含许多预组字符(Precomposed character),即事先将字符组好并赋予码位。所以有可能同时使用组合字符和预组字符。这导致了若要比较两个统一码字符串或设计编码转换器时,需要先执行Unicode正规化。[2]
在统一码中,用于欧洲语言和国际音标的组合用附加符号为〈U+0300–U+036F〉。组合用附加符号亦存在统一码中的多个区块。在统一码中,附加符号总是加在主要字符之后。因此,有可能加入多个附加符号。直到2006年,只有少数软件能正确显示此类组合。