Loading AI tools
漢字輸入法 来自维基百科,自由的百科全书
五筆字型輸入法,简称五笔、又稱王碼,是王永民在1983年8月发明的一种汉字输入法。中文输入法的编码方案很多,但基本依据都是汉字的读音和字形两种属性。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。
此條目需要补充更多来源。 (2019年3月30日) |
五筆字型輸入法主要用于使用简体中文的中国大陆,过去,拼音輸入法严重重码,五笔输入是最方便的选择。但随着智能拼音的兴起,以及拼音输入法天然的“零训练”特性(对于掌握汉语拼音的使用者,拼音输入法几乎不必专门练习),需要专门训练才能熟练应用的五笔输入法在应用人数上已经不具备优势。但极低的重码率,保证了五笔的输入速度仍遥遥领先,因此大多数专业打字员至今[何时?]仍然习惯使用五笔字型。
王永民自1983年发明五笔字型以来,共推出了三种编码方案,即86版、98版和新世纪版:
86版也就是老式的五笔,又称4.5版,顧名思義於1986年推出。使用130个字根,可处理GB 2312-80汉字集中的6763个汉字。由于习惯问题,它至今仍然是拥有用户群最为巨大的编码方案。同時,此版本專利權已過,其編碼進入了開源領域,其他人可以自由使用和修改,也促進了此版本的流傳。
後來王碼官方改進了原86版一些爭議的編碼,包括取消了原86版的一些「无理码」,规范了识别码等。因此又有原86版和調整後的86版兩種編碼。在官方網站上编码查询的结果,只會顯示調整後的86版。然而坊間不少輸入法軟件仍採用原86版的編碼,未經調整。
98版是一种改进型的方案,於1998年推出,其编码的科学性更强、更易于学习和使用。使用259个码元,可处理GBK汉字集中的21003个简繁汉字。但二者在编码原则上大同小异。
新世纪版于2008年1月28日推出,采用新设计的字根体系更加符合分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入更容易,可以处理GB 18030-2000汉字集中的27533个简繁汉字。
设计者认为,86版的字根设置不如98版和新世纪版科学。但是由于86版较先发布,且98版和新世纪版五笔字型编码的专利权尚掌握在王码公司手中,而王码公司反对其他公司在未授权的情况下开发和发行五笔字型输入法[1],因此86版五笔字型编码及相关软件的使用者和输入法程序都比98版和新世纪版多。
五笔字根是五笔输入法的基本单元,86版使用234个字根,98版使用259个字根,新世纪版使用了226个字根。
基本字根在组成汉字时,按照它们之间的位置关系可以分成四类结构。
在五笔中,汉字分为左右型、上下型和杂合型汉字。
五笔将汉字笔划分为五个区:即:横(同提)、竖、撇、捺(同点)、折五区。把字根或码元按一定规律分布在25个字母键上(即标准的QWERTY键盘,不包括Z)。取码时最长四码,最短一码。
2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。[1]
键名是指各键位左上角的黑体字根,它们是组字频度较高,而形体上又有一定代表性的字根,它们中绝大多数本身就是汉字,只要把它们所在键连击四次就可以了。如:王:11 11 11 11(GGGG)
在每个键位上,除了一个键名字根外,还有数量不等的几种其它字根,它们中间的一部分其本身也是一个汉字,我们称之为成字字根。 输入方法:键名代码+首笔代码+次笔代码+末笔代码(如果该字根只有两笔画,则补空格键结束)
86版五笔字根
98版五笔字根
新世纪版五笔字根
除键名字和成字字根汉字之外的汉字,如果一个字可以取够四个字根,就全部用字根键入,只有在不足四个字根的情况下,才有必要追加识别码。
当一个字拆不够4个码元时,它的输入编码是:先打完码元,再追加一个“末笔字型识别码”,简称“识别码”。末笔字型识别码由汉字的末笔画代码和字型代码组成。
末笔画代码看这个字的末笔画的结构来决定的:
字型代码是看此字的结构来的决定的:
最后组合起来就是识别码。例如"好"字,他最后笔画为“一”,所以末笔画代码就是“1”,好是左右型结构的汉字,所以“好”字的字型代码也是“1”,所以“好”识别码就是“11”,在“G”键上。
取第一字的前两位编码和第二字的前两位编码,如“北”(UXN)+“京”(YIU)=“北京”(UXYI)
取第一字的第一位编码,第二位的第一位编码,第三字的前两位编码,如“毛”(TFNV)+“泽”(ICFH)+“东”(AII)=“毛泽东”(TIAI)
取每一个字的第一位编码,如“六”(UYGY)+“十”(FGH)+“四”(LHNG)+“卦”(FFHY)=“六十四卦”(UFLF)
取一、二、三、末字的第一位编码,如“中”(KHK)+“国”(LGYI)+“共”(AWU)+“产”(UTE)+“党”(IPKQ)=“中国共产党”(KLAI)
指一些较常用字可以用一、二或三字母编码打出,分别称为一、二、三级简码
一级简码包含汉语(尤其是官方语体)最常用字中的25个,为了尽可能全面地安排最常用的汉字,部分一级简码并非是该字全码的首位。
但所有的二级或三级简码均为该字全码的前二或三位
一级简码如下,86版、98版和新世纪版通用
编码 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
文字 | 工 | 了 | 以 | 在 | 有 | 地 | 一 | 上 | 不 | 是 | 中 | 国 | 同 | 民 | 为 | 这 | 我 | 的 | 要 | 和 | 产 | 发 | 人 | 经 | 主 |
由于五笔字型中,采用五种笔划,每个字根或码元只取前两划定位它们在键盘上的位置,所以五笔字型汉字编码只用到了5×5=25个字母键。每个字的编码中都没有“Z”。后来大部分五笔输入软件都附与Z键查询功能,又叫作“万能键”或“万能学习键”。初学者可以在对某个字不确定其拆分时,使用“Z”键代替不确定的字根或码元。也有一些五笔输入法使用“Z”键来实现拼音反查五笔或符号输入功能。早期DOS系统中Z键可以用在任何位置,然现今大多数五笔输入法中Z键均无法在首位作为不确定的字根代替码。一些输入法中若在首位输入Z则跳出特殊符号选择列表。
与“Z”键的用途为大多数熟知不同,“L”键在五笔编码中也有许多人不太了解的特殊用途:
类似地,早期版本的五笔将“靥”字的编码强制设为(DDDL),以避免和键名字“大”(DDDD)重复.
赞许观点 | 批评观点 |
---|---|
五笔键码短、输入快,多简码,一个字或一个词组最多只有四个码,适用于简化字。 | 五笔虽然单字的重码率低,但词组的重码率高,因此,五笔普遍不使用大词库,以防止过多重码,但词库太小时,打字反而不方便,尤其現在各種智能拼音輸入法的興起,五笔低重码率的优势已大大縮小。由於開始設計時是針對簡體字,雖然日後經過不斷改善,86、98版都可直接用正體字編碼,但使用效果上還有待進一步優化。 |
五笔练习对分拆汉字的能力是很好的训练,并能锻炼个人的认字能力。例如“尴尬”二字中的“尢”常被误写为“九”,五笔按“尢”拆分可以纠正这种错误观念。五笔输入法能在一定程度上避免使用拼音输入法过度而造成的提笔忘字的问题。 | 为了减少重码,五笔中有大量的无理码,这不符合汉字的结构和书写规范,因此,并不能锻炼人的认字能力,长期用无理码打字,使人们对汉字有了错误的认识,反而有害。中华人民共和国教育部就是因为这个原因没有在学校强制推广五笔。例如,按规范“力”“刀”“万”“方”“乃”等一类字的末笔应为撇,可是86版五笔字型却规定为折;“瓦”的末笔应为中间的点,86版五笔字型却规定为折;“戈”“戋”“我”“咸”“成”“戊”“戌”“戎”等一类字的末笔应为右上角的点,86版五笔字型却规定为倒数第二笔撇,凡此等等。[2]「傳言台灣教育部就是因此而將此類含有戈的字改筆序成先點後撇。」
此问题在98版及世纪版得到修正。 |
五筆只需考慮字形,可輕鬆地按編碼規則輸入自己會寫(或照稿子),但不認識不會讀的字。且中國方言眾多,漢字發音差異頗大,但字形相對統一,對於不會拼音或掌握不好的人,五筆佔優勢。 | 不適合輸入只知道發音而忘了怎麼寫的字。 |
較易實現盲打(不看屏幕),尤其單字時。而拼音不論單字還是詞組,都有極高的重碼率,只有在輸部份常用語句上才會惟一(或者說排在第一個選項上)(如:你好呀,我吃飯了,這是什麽)。对于古文、人名、生僻的专业术语,五筆的優勢非常明顯。 | 輸常用句子時,智慧拼音輸入法亦可盲打,且不輸五筆,甚至快於五筆(由於五筆在輸片語時,重碼率不再是優勢而一個句子又不能光用單字模式)。 |
会打五笔的人用字比打拼音更准确。 | 打字准不准确取决于打字者是否细心,没有错别字的拼音输入的文章很多,用五笔时出现的错别字也并不罕见。例如2012年11月3日《江南晚报》头版头条“乱揿喇叭被罚不要喊冤”写成了“乱揿嗽叭被罚不要喊冤”。[3] |
由于有五笔字型口诀,并不难于记忆。實際熟練後,打字時手指會自然地去尋找所需字根,并不像初學者那樣打個字時還得口中念念有詞。 | 五笔字型使用的是字根和码元作为输入时的助记符,86版使用130个字根,98版更需要使用245个字根,记忆量要比拼音或注音输入方法大。不仅如此,五笔字型的字根排布没有规律,远不及其它形码,增加了它的记忆难度。而且,五笔字型一旦有一段时间不用,就会忘记,需要重复学习,增加民众学习负担。 |
在王码五笔出现之后,又出现了许多其它的五笔输入法。由于86版编码的专利开放,它们大多採用86版的编码方式,但也有使用者个人提供98或新世纪版编码的码表。它们在造词等功能上加以改进,也获得了一定的用户群。这其中也有一部分是以五笔编码形式为主的输入平台,它们不仅可以以五笔方式来输入,也可以根据用户的需求安装不同的码表以提供其它编码的输入方式。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.