字位[註 1](英語:grapheme)又稱形素字素,是最小的有意義書寫符號單位;此術語是由語音學里的「音位」(音素)類推到文字學的。[1]拼音文字系統當中,「字位」是最小且數量最少的區別性單位,也是一個抽象單位。例如:字位<a>,無論任何字體字形是A,a,或是ɑ,都屬於同一個字位,它們的意義都相同(同位異形)。[2]象形文字系統當中,「字位」就是最小且有意義的區別性單位,中文即將同一個字的不同寫法(正體字、簡體字、二簡字、異體字、新字形、舊字形、訛字、缺筆字等)計算為同一個字位,而不是分別計算為不同的字位。

Quick Facts 文字, 文字系統類型(維基數據所列:Q119520394) ...
Close

計算一個文字系統的規模時,是以字位這個最小單位來計算的,而不是以字位變體。如:英文字母表當中雖然印有52個大小寫變體,但是仍然說英文字母有26個,即26個字位。

計算漢字數量時,大型字典會按照字形總數來計算,即將一個代表相同語音語義的簡化字、繁體字、異體、新字形、舊字形等等視為不同,而分別計算;這種計算方式實為是在計算變體。所以,長期以來錯誤地把大型字典里收入的「字形數」看作是漢字系統「字位數」的規模。

2004年德國有人對幾本大型漢語字典收錄的變體數量進行了研究,得出的結果是:[來源請求]

  1. 經過幾千年的積累,漢字系統的規模(總量)為:26,000左右個單位(類似拼音文字系統的字位單位)。[來源請求]
  2. 康熙字典》(42,171字(不包《備考》裡的音義不詳字))、《漢語大字典》(54,709字)、《中華字海》(85,586字)、台灣教育部《異體字字典》(116,000多)收字數量的差別在於:後出版的字典大量地增加變體,及不應該算作字和漢語漢字的符號(不成字的部件;日、朝、越及中國少數民族仿漢字造的字符等等),而字位單位數量並沒有增加多少。這四本字典的核心部分(字位單位數)是基本相當的[多少?],《康熙字典》只少約1,000個。[來源請求]

備註

註釋

參見

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.