特殊字元是Unicode的一個簡短的區段,分配在基本多文種平面的最末端,位於U+FFF0-FFFF。在這16個碼位中,有5個是從Unicode 3.0開始分配的。

  • U+FFF9 行間註解錨,標誌著註解文字的開始。
  • U+FFFA 行間註解分隔符,標記註解字元的開始。
  • U+FFFB 行間註解終止符,標誌著註解塊的結束。
  • U+FFFC  OBJECT REPLACEMENT CHARACTER,在文字中為另一個未指定的對象提供預留位置,例如在一個複合檔案中。
  • U+FFFD � REPLACEMENT CHARACTER(替換字元),用於替換一個未知的、不被認可的或無法表示的字元。
  • U+FFFE <非字元-FFFE> 不是一個字元。
  • U+FFFF <非字元-FFFF> 不是一個字元。
Quick Facts 特殊字元 Specials, 範圍 ...
特殊字元
Specials
範圍U+FFF0..U+FFFF
(16個碼位)
平面基本多文種平面BMP
文字通用
已分配5個碼位
未分配9個保留碼位
2個非字元
統一碼版本歷史
1.0.01 (+1)
2.12 (+1)
3.05 (+3)
碼表
點擊此處
註釋[1][2]
Close

FFFE和FFFF不是通常意義上的未分配字元,但不是Unicode字元。它們可以用來猜測一個文字的編碼方案,因為根據定義,任何包含這些的文字都不是一個正確編碼的Unicode文字。Unicode的U+FEFF BYTE ORDER MARK字元可以插在Unicode文字的開頭,以表示它的位元組性:一個程式在閱讀這樣的文字並遇到0xFFFE時,就會知道它應該為後面的所有字元轉換位元組順序。

它在Unicode 1.0中的區段名是特殊。[3]

特殊字元[1][2][3]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FFFx IAA IAS IAT
注釋
1.^ 依據Unicode 15.0
2.^ 灰色區域表示未分配的代碼點。
3.^ 黑色區域表示非字元英語Universal_Character_Set_characters#Non-characters(保證在Unicode標準中永遠不會被分配為編碼字元的碼位)。

歷史

參考資料

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.