Loading AI tools
在JIS X 0208所收錄的漢字中,字形來源不明的漢字 来自维基百科,自由的百科全书
幽靈漢字(日语:幽霊漢字/ゆうれいかんじ Yūrē kanji */?),又稱幽靈文字(日语:幽霊文字/ゆうれいもじ Yūrē moji)是JIS基本漢字所收錄的出處不明漢字的總称。
1978年,當時的通商產業省制定的JIS C 6226(後來的JIS X 0208)中規定了JIS第1、第2水準漢字6349字。該漢字集稱為「JIS基本漢字」。當時以下列4個漢字表為典據,採用了其中的漢字:[1]。
但制定JIS基本漢字時,由於規格未要求明示各文字的典據,JIS基本漢字中出現了不少不僅音、義、歷史,而且連用例都不明確的文字,即所謂的「幽靈文字」,大約有60字,一說超過100字。
垉(52区21点) | 垈(52区18点) | 墸(52区55点) |
壥(52区63点) | 妛(54区12点) | 岾(54区19点) |
彁(55区27点) | 恷(55区78点) | 挧(57区43点) |
暃(58区83点) | 椦(59区91点) | 橸(60区81点) |
汢(61区73点) | 熕(63区80点) | 碵(66区83点) |
穃(67区46点) | 粐(68区68点) | 粭(68区70点) |
粫(68区72点) | 糘(68区84点) | 膤(71区19点) |
蟐(74区12点) | 袮(74区57点) | 軅(77区32点) |
鍄(78区93点) | 閠(79区64点) | 靹(80区56点) |
駲(81区50点) | 鵈(82区94点) |
最具代表性的有「妛」、「彁」等字,不僅《康熙字典》中未收錄,追加了国字、新字体等的諸橋轍次的《大漢和辭典》(2000年補充了含部分JIS基本漢字的《補卷》除外)中也沒有記載。
基於此情況,1997年制定改定規格時,其原案作成委員会以委員長芝野耕司和國立國語研究所的笹原宏之等人為中心,調查了1978年規格的原案編制時參考的文獻。其結果是原本被視為幽靈漢字的,多數為地名等實際有使用的漢字。
根據調查,早於1978年規格原案編制,行政管理廳在1974年整理包括上述1-3的8個漢字表並編制了《以行政情報處理用標準漢字選定為目標的漢字使用頻度及對應分析結果》(行政情報処理用標準漢字選定のための漢字の使用頻度および対応分析結果,下稱「對應分析結果」),其中漢字表和原典均有記載。選定JIS基本漢字時參照的是對應分析結果而非原典,調查發現其中包含了很多來源於《國土行政區畫總覽》《日本生命收容人名漢字》的幽靈文字。特別是《日本生命收容人名漢字》在第1次規格的原案編制時,原典已經佚失,因此被批評為內容存在缺陷。[2]在此結果基礎上,改定規格的委員會用校正履歷復原了《國土行政區畫總覽》1972年版,並逐頁校覈其中出現的漢字。此外,他們以日本電信電話(NTT)和日本電信電話公社(電電公社)的電話簿資料庫為名用例,取代現已不存的《日本生命收容人名漢字》,進行比較調查,並以30本以上的古今的字書為調查對象,進行徹底的文獻參照。
另一方面,經過嚴密的調查後,仍有12個漢字來源不明。儘管多數來源不明的漢字也發現有各種線索,例如和古字書同形衝突的文字,或推測為資料傳抄時出錯,但是其中仍有「彁」這一字無任何線索[3]。因此,現時真正的幽靈漢字為此12字,狹義上則只有「彁」一字。
前述的笹原宏之的調查結果整理收錄於JIS X 0208:1997附屬書7《区点位置詳說》。本節選錄其中一部分。
字 | 码位 | 來源 | 偶然一致例 |
---|---|---|---|
墸 | 52-55 | 來源不明。有偶合的例子。 | 《集韻》抄本中有,但或為誤寫;又可能是「躇」的異體字 |
壥 | 52-63 | 來源不明。可能是「㕓」的誤寫。 | 《倭玉篇》 |
妛 | 54-12 | 來源為《國土行政區劃總覽》,但未發現。可能是「𡚴」的誤認。 | 《字鏡集》等中有,但或為誤寫 |
彁 | 55-27 | 對應分析結果中無(來源不明)。可能是「彊」的誤寫。 | 無法同定 |
挧 | 57-45 | 來源為《國土行政區劃總覽》,但未發現。可能是「栩」的誤寫。 | 《中華字海》等 |
暃 | 58-83 | 來源為《國土行政區劃總覽》,但未發現。可能是「杲」等的誤寫。 | 《法華三大部難字記》 |
椦 | 59-91 | 來源為《國土行政區劃總覽》,但未發現。可能是「橳」的誤寫。 | 《一切經音義》 |
槞 | 60-57 | 來源為《國土行政區劃總覽》,但未發現。可能是「橦」的誤寫。 | 《宋元以来俗字譜》 |
蟐 | 74-12 | 來源為《行政情報處理基本漢字》,但無用例。 | 《新撰字鏡》 |
袮 | 74-57 | 來源為《國土行政區劃總覽》,但未發現。可能是「祢」的誤寫。 | 《新撰字鏡》《類聚名義抄》等 |
閠 | 79-64 | 來源為《國土行政區劃總覽》,但未發現。可能是「閏」的錯別字。 | 宋版《廣韻》中有,但或為誤寫 |
駲 | 81-50 | 來源為《日本生命人名表》,但原典已丟失。 | 《類聚名義抄》 |
文字 | 码位 | 來源 |
---|---|---|
垈 | 52-18 | 《國土行政區畫總覽》中有用例:藤垈(ふじぬた)、相垈(あいぬた)、大垈(おんた)/山梨縣 |
垉 | 52-21 | 《國土行政區畫總覽》中有用例。垉六(ほうろく)/愛知縣 |
岾 | 54-19 | 《國土行政區畫總覽》中有用例,但現已不存。広岾町(ひろやまちょう)→広帖町(こうちょうちょう)/京都府 |
恷 | 55-78 | 出典為《日本生命人名表》。NTT電話簿中有人名用例。 |
橸 | 60-81 | 《日本地名大辞典》中有用例。石橸(いしだる)/靜岡縣 |
汢 | 61-73 | 《國土行政區畫總覽》中有用例,但原典中為誤字。汢の川→の川(ぬたのかわ)[7]/高知縣。2002年1月1日,考慮到便利性和用例,改用「汢」。有偶然一致例。 |
碵 | 66-83 | 出自《日本生命人名表》。NTT電話簿中有人名用例。 |
穃 | 67-46 | 《國土行政區畫總覽》中有用例,但原典中為誤字。穃原→榕原(ようばる)/沖繩縣 |
粐 | 68-68 | 《國土行政區畫總覽》中有用例。粐蒔沢(ぬかまきざわ)[8]/秋田縣 |
粭 | 68-70 | 《國土行政區畫總覽》中有用例。粭島(すくもじま)/山口縣 |
粫 | 68-72 | 《國土行政區畫總覽》中有用例,但原典中為誤字。粫田(うるちだ)→糯田(もちだ)/福島縣 |
糘 | 68-84 | 《國土行政區畫總覽》中有用例。糘尻(すくもじり)/廣島縣 |
膤 | 71-19 | 《國土行政區畫總覽》中有用例。膤割(ゆきわり)/熊本縣 |
軅 | 77-32 | 《國土行政區畫總覽》中有用例,但現已不存。軅飛(たかとぶ)→鷹飛(たかとび)/福島縣 |
鍄 | 78-93 | 《國土行政區畫總覽》中有用例。小鍄(こがすがい)/山形縣 |
鵈 | 82-94 | 《國土行政區畫總覽》中有用例,但原典中為誤字。鵈沢→鵃沢(みさごさわ)/福島縣。有偶然一致例 |
JIS漢字標準制定後,一些新出版的辭典以JIS基本漢字全覆蓋為編纂方針。但由於JIS基本漢字中收錄的幽靈文字缺少典據,編纂時的處理方式各異,常見方式包括以下幾種。
笹原宏之等人對幽靈文字的調查是1997年的JIS漢字改正工作中的一環。JIS漢字改正曾於1983年的「83JIS改正」中,對字形、文字編碼作出大幅變更,引起了嚴重的混亂,而本次改正則不希望重蹈覆轍。另外,由於JIS漢字已經收錄於Unicode,此時對JIS的變更已經不僅是日本國內的問題。結果,幽靈文字不僅在JIS基本漢字中被保留,也可以通过计算机字体於全世界的電腦中使用。
原本來源不明的文字,即使弄清了其正字、字義,使用頻率依然不高。實際上,被判定為錯別字的漢字有時會用來代用本字,而至今仍來源不明的字有時會用來代用字形相似的文字,作為異字、代替字、俗字而存在。
另外,有人利用幽靈文字「來源不明」「讀法不明」的特性,將其作為暗号文書,即所謂「忍者文字」。
2011年,《朝日新聞》在自社數據庫以幽靈文字「彁」爲關鍵字檢索,命中一條大正12年(1923)2月23日的新聞,其中出現「埼玉自彁会」文本[14]。在掃描圖像更加清晰的「朝日新聞〈復刻版〉」中檢索同一新聞,可見原文本正是「埼玉自彊會」,而在舊版低分辨率掃描圖像中形似「彁」,《朝日新聞》據此更正了檢索系統文本。這也爲前文中笹原宏之在1997年JIS基本漢字修訂時對「彁」來自「彊」(「強」的異體字)之誤寫的推測提供了一條實例。但是,此篇1923年的新聞未必是「彁」的起源或唯一實例,1978年制訂的JIS基本漢字完全可能根據更早的材料誤識而收錄「彁」字,在此之後,《朝日新聞》電子化的員工才基於相似的誤識情形,得以調用已存在於JIS字符集的「彁」字。
“幽灵汉字”是日语中的说法,不少幽灵汉字在汉语中有意义,如:
以下汉字仍无出处:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.