Loading AI tools
漢字輸入法 来自维基百科,自由的百科全书
五筆字型輸入法,簡稱五筆、又稱王碼,是王永民在1983年8月發明的一種漢字輸入法。中文輸入法的編碼方案很多,但基本依據都是漢字的讀音和字形兩種屬性。五筆字型完全依據筆畫和字形特徵對漢字進行編碼,是典型的形碼輸入法。
此條目需要補充更多來源。 (2019年3月30日) |
五筆字型輸入法主要用於使用簡體中文的中國大陸,過去,拼音輸入法嚴重重碼,五筆輸入是最方便的選擇。但隨着智能拼音的興起,以及拼音輸入法天然的「零訓練」特性(對於掌握漢語拼音的用戶,拼音輸入法幾乎不必專門練習),需要專門訓練才能熟練應用的五筆輸入法在應用人數上已經不具備優勢。但極低的重碼率,保證了五筆的輸入速度仍遙遙領先,因此大多數專業打字員至今[何時?]仍然習慣使用五筆字型。
王永民自1983年發明五筆字型以來,共推出了三種編碼方案,即86版、98版和新世紀版:
86版也就是老式的五筆,又稱4.5版,顧名思義於1986年推出。使用130個字根,可處理GB 2312-80漢字集中的6763個漢字。由於習慣問題,它至今仍然是擁有用戶群最為巨大的編碼方案。同時,此版本專利權已過,其編碼進入了開源領域,其他人可以自由使用和修改,也促進了此版本的流傳。
後來王碼官方改進了原86版一些爭議的編碼,包括取消了原86版的一些「無理碼」,規範了辨識碼等。因此又有原86版和調整後的86版兩種編碼。在官方網站上編碼查詢的結果,只會顯示調整後的86版。然而坊間不少輸入法軟件仍採用原86版的編碼,未經調整。
98版是一種改進型的方案,於1998年推出,其編碼的科學性更強、更易於學習和使用。使用259個碼元,可處理GBK漢字集中的21003個簡繁漢字。但二者在編碼原則上大同小異。
新世紀版於2008年1月28日推出,採用新設計的字根體系更加符合分區劃位規律,更加科學易記而實用,按規範筆順寫漢字的人,取碼輸入更容易,可以處理GB 18030-2000漢字集中的27533個簡繁漢字。
設計者認為,86版的字根設置不如98版和新世紀版科學。但是由於86版較先發佈,且98版和新世紀版五筆字型編碼的專利權尚掌握在王碼公司手中,而王碼公司反對其他公司在未授權的情況下開發和發行五筆字型輸入法[1],因此86版五筆字型編碼及相關軟件的用戶和輸入法程式都比98版和新世紀版多。
五筆字根是五筆輸入法的基本單元,86版使用234個字根,98版使用259個字根,新世紀版使用了226個字根。
基本字根在組成漢字時,按照它們之間的位置關係可以分成四類結構。
在五筆中,漢字分為左右型、上下型和雜合型漢字。
五筆將漢字筆劃分為五個區:即:橫(同提)、豎、撇、捺(同點)、折五區。把字根或碼元按一定規律分佈在25個字母鍵上(即標準的QWERTY鍵盤,不包括Z)。取碼時最長四碼,最短一碼。
2006年12月,王永民又在此基礎上,研究出用於手機輸入的基於6個碼元和「右手法則——前四末一」取碼法的數字王碼。[1]
鍵名是指各鍵位左上角的黑體字根,它們是組字頻度較高,而形體上又有一定代表性的字根,它們中絕大多數本身就是漢字,只要把它們所在鍵連擊四次就可以了。如:王:11 11 11 11(GGGG)
在每個鍵位上,除了一個鍵名字根外,還有數量不等的幾種其它字根,它們中間的一部分其本身也是一個漢字,我們稱之為成字字根。 輸入方法:鍵名代碼+首筆代碼+次筆代碼+末筆代碼(如果該字根只有兩筆畫,則補空格鍵結束)
86版五筆字根
98版五筆字根
新世紀版五筆字根
除鍵名字和成字字根漢字之外的漢字,如果一個字可以取夠四個字根,就全部用字根鍵入,只有在不足四個字根的情況下,才有必要追加辨識碼。
當一個字拆不夠4個碼元時,它的輸入編碼是:先打完碼元,再追加一個「末筆字型辨識碼」,簡稱「辨識碼」。末筆字型辨識碼由漢字的末筆畫代碼和字型代碼組成。
末筆畫代碼看這個字的末筆畫的結構來決定的:
字型代碼是看此字的結構來的決定的:
最後組合起來就是辨識碼。例如"好"字,他最後筆畫為「一」,所以末筆畫代碼就是「1」,好是左右型結構的漢字,所以「好」字的字型代碼也是「1」,所以「好」辨識碼就是「11」,在「G」鍵上。
取第一字的前兩位編碼和第二字的前兩位編碼,如「北」(UXN)+「京」(YIU)=「北京」(UXYI)
取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼,如「毛」(TFNV)+「澤」(ICFH)+「東」(AII)=「毛澤東」(TIAI)
取每一個字的第一位編碼,如「六」(UYGY)+「十」(FGH)+「四」(LHNG)+「卦」(FFHY)=「六十四卦」(UFLF)
取一、二、三、末字的第一位編碼,如「中」(KHK)+「國」(LGYI)+「共」(AWU)+「產」(UTE)+「黨」(IPKQ)=「中國共產黨」(KLAI)
指一些較常用字可以用一、二或三字母編碼打出,分別稱為一、二、三級簡碼
一級簡碼包含漢語(尤其是官方語體)最常用字中的25個,為了儘可能全面地安排最常用的漢字,部分一級簡碼並非是該字全碼的首位。
但所有的二級或三級簡碼均為該字全碼的前二或三位
一級簡碼如下,86版、98版和新世紀版通用
編碼 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
文字 | 工 | 了 | 以 | 在 | 有 | 地 | 一 | 上 | 不 | 是 | 中 | 國 | 同 | 民 | 為 | 這 | 我 | 的 | 要 | 和 | 產 | 發 | 人 | 經 | 主 |
由於五筆字型中,採用五種筆劃,每個字根或碼元只取前兩劃定位它們在鍵盤上的位置,所以五筆字型漢字編碼只用到了5×5=25個字母鍵。每個字的編碼中都沒有「Z」。後來大部分五筆輸入軟件都附與Z鍵查詢功能,又叫作「萬能鍵」或「萬能學習鍵」。初學者可以在對某個字不確定其拆分時,使用「Z」鍵代替不確定的字根或碼元。也有一些五筆輸入法使用「Z」鍵來實現拼音反查五筆或符號輸入功能。早期DOS系統中Z鍵可以用在任何位置,然現今大多數五筆輸入法中Z鍵均無法在首位作為不確定的字根代替碼。一些輸入法中若在首位輸入Z則跳出特殊符號選擇列表。
與「Z」鍵的用途為大多數熟知不同,「L」鍵在五筆編碼中也有許多人不太了解的特殊用途:
類似地,早期版本的五筆將「靨」字的編碼強制設為(DDDL),以避免和鍵名字「大」(DDDD)重複.
讚許觀點 | 批評觀點 |
---|---|
五筆鍵碼短、輸入快,多簡碼,一個字或一個詞組最多只有四個碼,適用於簡化字。 | 五筆雖然單字的重碼率低,但詞組的重碼率高,因此,五筆普遍不使用大詞庫,以防止過多重碼,但詞庫太小時,打字反而不方便,尤其現在各種智能拼音輸入法的興起,五筆低重碼率的優勢已大大縮小。由於開始設計時是針對簡體字,雖然日後經過不斷改善,86、98版都可直接用繁體字編碼,但使用效果上還有待進一步優化。 |
五筆練習對分拆漢字的能力是很好的訓練,並能鍛煉個人的認字能力。例如「尷尬」二字中的「尢」常被誤寫為「九」,五筆按「尢」拆分可以糾正這種錯誤觀念。五筆輸入法能在一定程度上避免使用拼音輸入法過度而造成的提筆忘字的問題。 | 為了減少重碼,五筆中有大量的無理碼,這不符合漢字的結構和書寫規範,因此,並不能鍛煉人的認字能力,長期用無理碼打字,使人們對漢字有了錯誤的認識,反而有害。中華人民共和國教育部就是因為這個原因沒有在學校強制推廣五筆。例如,按規範「力」「刀」「万」「方」「乃」等一類字的末筆應為撇,可是86版五筆字型卻規定為折;「瓦」的末筆應為中間的點,86版五筆字型卻規定為折;「戈」「戔」「我」「咸」「成」「戊」「戌」「戎」等一類字的末筆應為右上角的點,86版五筆字型卻規定為倒數第二筆撇,凡此等等。[2]「傳言台灣教育部就是因此而將此類含有戈的字改筆序成先點後撇。」
此問題在98版及世紀版得到修正。 |
五筆只需考慮字形,可輕鬆地按編碼規則輸入自己會寫(或照稿子),但不認識不會讀的字。且中國方言眾多,漢字發音差異頗大,但字形相對統一,對於不會拼音或掌握不好的人,五筆佔優勢。 | 不適合輸入只知道發音而忘了怎麼寫的字。 |
較易實現盲打(不看螢幕),尤其單字時。而拼音不論單字還是詞組,都有極高的重碼率,只有在輸部份常用陳述式上才會惟一(或者說排在第一個選項上)(如:你好呀,我吃飯了,這是什麽)。對於古文、人名、生僻的專業術語,五筆的優勢非常明顯。 | 輸常用句子時,智能拼音輸入法亦可盲打,且不輸五筆,甚至快於五筆(由於五筆在輸片語時,重碼率不再是優勢而一個句子又不能光用單字模式)。 |
會打五筆的人用字比打拼音更準確。 | 打字準不準確取決於打字者是否細心,沒有錯別字的拼音輸入的文章很多,用五筆時出現的錯別字也並不罕見。例如2012年11月3日《江南晚報》頭版頭條「亂撳喇叭被罰不要喊冤」寫成了「亂撳嗽叭被罰不要喊冤」。[3] |
由於有五筆字型口訣,並不難於記憶。實際熟練後,打字時手指會自然地去尋找所需字根,並不像初學者那樣打個字時還得口中念念有詞。 | 五筆字型使用的是字根和碼元作為輸入時的輔助記憶碼,86版使用130個字根,98版更需要使用245個字根,記憶量要比拼音或注音輸入方法大。不僅如此,五筆字型的字根排布沒有規律,遠不及其它形碼,增加了它的記憶難度。而且,五筆字型一旦有一段時間不用,就會忘記,需要重複學習,增加民眾學習負擔。 |
在王碼五筆出現之後,又出現了許多其它的五筆輸入法。由於86版編碼的專利開放,它們大多採用86版的編碼方式,但也有用戶個人提供98或新世紀版編碼的碼表。它們在造詞等功能上加以改進,也獲得了一定的用戶群。這其中也有一部分是以五筆編碼形式為主的輸入平台,它們不僅可以以五筆方式來輸入,也可以根據用戶的需求安裝不同的碼表以提供其它編碼的輸入方式。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.