Loading AI tools
来自维基百科,自由的百科全书
在 Unicode 中,字符變體指通過編碼字符序列顯示同一字符的不同字形。這種變體序列(英語:variation sequence)由一個基本字符後緊跟一個變體選擇符(variation selector)組成。
一個字符的變體通常與它的基本字符有非常相像的外觀和涵義。這項技術旨在當一個字符的變體字形不可用時,仍顯示其基本字符,卻不改變文本本身的涵義。
Unicode 定義了兩種變體序列:
StandardizedVariants.txt
收錄的變體序列[1]IVD_Sequences.txt
收錄的變體序列[2][3]變體選擇符定義於數個 Unicode區塊內:
Unicode 是一個字符編碼表,它只是一個表格,並不描繪每個字形的樣式。同樣意義的字符常會被賦予相同的編碼。因此,在一些情況下,有必要區分不同的字形[4]。
須注意的是,譬如拉丁字母「a」是否有從頂部向右延伸的線,通常不屬於不同字形之間的差異,因為可以通過更改電腦字型來修改。可是,在中日韓統一表意文字中,本來根據 Unicode 的認同原則應該統合的漢字異體字字形,卻在一些國家或地方的電腦應用標準裏,經常被視為是「另一個字」的字形。擧例說,「値」與「值」字形差異細微,讀音、意義都一樣,一般書寫和閱讀時都不會視為兩個不同的字,理論上可以合併。但是,在個別國家或地區裏,此二字在某些情況中出現時,會被當作相異的資訊。因此,根據情況,有時需要在純文本上保存不同字形的區別,例如:
爲了應付這類情況,早期 Unicode 碰到在有關國家或地區既有碼表已分別編碼的字,像「値」與「值」,就會放棄認同原則,改以原字集分離原則來把兩個字形分別編碼。但若當時有關國家或地區沒有把異體字分別編碼,像日本的JIS90只收錄了一個「葛」字,Unicode就不會分別編碼。
變體選擇符是為了在 Unicode 中解決上述問題而設計出的特殊的「字符」,讓有着相同碼位的異體字(即「葛」字這類例子)可在純文本環境下分別顯示出來。它可以根據前後文來判斷,決定在當前文本中所使用的文字,並由變體選擇符選擇不同的字形[8]。請注意,顯示出來的會是變體選擇符所指定的字形,而不是變體選擇符本身。
變體序列一般分兩種:標準變體序列(Standardized Variation Sequence,簡稱「SVS」[9]),以及表意文字變體序列(Ideographic Variation Sequence,簡稱「IVS」)。
SVS 在非漢字及中日韓統一表意文字中均有啟用,這種字形選擇,定義為 Unicode 的標準化變體[10]。要在標準化變體裏添加字形,是統一碼聯盟的工作。
另一方面,IVS 是漢字專用的變體選擇符,字形收集是由表意文字變體數據庫(Ideographic Variation Database,簡稱為「IVD」)定義的。要想在 IVD 中增加字形,也必須根據規定向統一碼聯盟申請[11]。
截至2017年12月,由變體序列所使用的變體字符如下所示:
標準變體序列錄入的字集和數量
表意文字變體數據庫錄入的字集和數量
但是Hanyo-Denshi與Adobe-Japan1有很多重複[14]。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.