五笔字型输入法
字根
五笔字根是五笔输入法的基本单元,86版使用234个字根,98版使用259个字根,新世纪版使用了226个字根。
五笔中的汉字结构及字型
基本字根在组成汉字时,按照它们之间的位置关系可以分成四类结构。
单:基本字根本身就单独成为一个汉字。这种情况包括键名字和成字字根。如:口、木、竹等。
散:指构成汉字的基本字根之间可以保持一定的距离。如:汉、湘、结、别、安、意等。
连:指一个基本字根连一单笔画。如:“丿”连“目”成为“自”。
交:指几个基本字根交叉套迭之后构成的汉字。如“申”是由“日”交“丨”,“夷”由“一”交“弓”交“人”交叉构成。
在五笔中,汉字分为左右型、上下型和杂合型汉字。
取码原理
这是五笔98码元的示意图。仅供参考
五笔将汉字笔划分为五个区:即:横(同提)、竖、撇、捺(同点)、折五区。把字根或码元按一定规律分布在25个字母键上(即标准的QWERTY键盘,不包括Z)。取码时最长四码,最短一码。
2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。
键名字
键名是指各键位左上角的黑体字根,它们是组字频度较高,而形体上又有一定代表性的字根,它们中绝大多数本身就是汉字,只要把它们所在键连击四次就可以了。如:王:11 11 11 11(GGGG)
成字字根
在每个键位上,除了一个键名字根外,还有数量不等的几种其它字根,它们中间的一部分其本身也是一个汉字,我们称之为成字字根。 输入方法:键名代码+首笔代码+次笔代码+末笔代码(如果该字根只有两笔画,则补空格键结束)
86版五笔字根
1区横起笔 11G 王旁青头戋(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石厂 14S 木丁西 15A 工戈草头右框七
2区竖起笔 21H 目具上止卜虎皮 22J 日早两竖与虫依 23K 口与川,字根稀 24L 田甲方框四车力 25M 山由贝,下框几
3区撇起笔 31T 禾竹一撇双人立,反文条头共三一 32R 白手看头三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺点无尾鱼,犬旁留儿一点夕,氏无七(妻)
4区点起笔 41Y 言文方广在四一,高头一捺谁人去 42U 立辛两点六门疒(病) 43I 水旁兴头小倒立 44O 火业头,四点米 45P 之字军盖道建底,摘礻(示)衤(衣)
5区折起笔 51N 已半巳满不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴马,丢矢矣 55X 慈母无心弓和匕,幼无力
98版五笔字根
1区横起笔 11 G 王旁青头五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石厂 14 S 木丁西甫一四里 15 A 工戈草头右框七
2区竖起笔 21 H 目上卜止虎头具 22 J 日早两竖与虫依 23 K 口中两川三个竖 24 L 田甲方框四车里 25 M 山由贝骨下框里
3区撇起笔 31 T 禾竹反文双人立 32 R 白斤气丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登头单人几 35 Q 金夕鸟儿犭边鱼
4区点起笔 41 Y 言文方点谁人去 42 U 立辛六羊病门里 43 I 水族三点鳖头小 44 O 火业广鹿四点米 45 P 之字宝盖补礻衤
5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶马失蹄 55 X 幺母贯头弓和匕
新世纪版五笔字根
1区横起笔 11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七
2区竖起笔 21 H 目止具头卜虎皮 22 J 日早两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里
3区撇起笔 31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼
4区点起笔 41 Y 言文方点在四一 42 U 立带两点病门里 43 I 水边一族三点小 44 O 火变三态广二米 45 P 之字宝盖补示衣
5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃齿底 53 V 女刀九巡录无水 54 C 又巴甬矣马失蹄 55 X 幺母绞丝弓三匕
单字输入
除键名字和成字字根汉字之外的汉字,如果一个字可以取够四个字根,就全部用字根键入,只有在不足四个字根的情况下,才有必要追加识别码。
末笔字型识别码
当一个字拆不够4个码元时,它的输入编码是:先打完码元,再追加一个“末笔字型识别码”,简称“识别码”。末笔字型识别码由汉字的末笔画代码和字型代码组成。
末笔画代码看这个字的末笔画的结构来决定的:
横 1
竖 2
撇 3
捺 4
折 5
字型代码是看此字的结构来的决定的:
左右结构型 1
上下结构型 2
其他结构型 3
最后组合起来就是识别码。例如"好"字,他最后笔画为“一”,所以末笔画代码就是“1”,好是左右型结构的汉字,所以“好”字的字型代码也是“1”,所以“好”识别码就是“11”,在“G”键上。
拆分原则
能散不连
兼顾直观
能连不交
取大优先
简码字
指一些较常用字可以用一、二或三字母编码打出,分别称为一、二、三级简码
一级简码包含汉语(尤其是官方语体)最常用字中的25个,为了尽可能全面地安排最常用的汉字,部分一级简码并非是该字全码的首位。
但所有的二级或三级简码均为该字全码的前二或三位
一级简码如下,86版、98版和新世纪版通用
特殊键
“Z”键
由于五笔字型中,采用五种笔划,每个字根或码元只取前两划定位它们在键盘上的位置,所以五笔字型汉字编码只用到了5×5=25个字母键。每个字的编码中都没有“Z”。后来大部分五笔输入软件都附与Z键查询功能,又叫作“万能键”或“万能学习键”。初学者可以在对某个字不确定其拆分时,使用“Z”键代替不确定的字根或码元。也有一些五笔输入法使用“Z”键来实现拼音反查五笔或符号输入功能。早期DOS系统中Z键可以用在任何位置,然现今大多数五笔输入法中Z键均无法在首位作为不确定的字根代替码。一些输入法中若在首位输入Z则跳出特殊符号选择列表。
“L”键
与“Z”键的用途为大多数熟知不同,“L”键在五笔编码中也有许多人不太了解的特殊用途:
类似地,早期版本的五笔将“靥”字的编码强制设为(DDDL),以避免和键名字“大”(DDDD)重复.
以旧字型为本
笔画“㇀”(提),一般写法当作“丶”(点),有时手写体竖钩(亅)以“一”(横)或“乙”(折)代替。
“象”字,简体字写法中间为口(K),而实际用横日(J)
评价
版本
王永民自1983年发明五笔字型以来,共推出了三种编码方案,即86版、98版和新世纪版:
86版
86版也就是老式的五笔,又称4.5版,顾名思义于1986年推出。使用130个字根,可处理GB 2312-80汉字集中的6763个汉字。由于习惯问题,它至今仍然是拥有用户群最为巨大的编码方案。
后来王码官方改进了原86版一些争议的编码,包括取消了原86版的一些无理码,规范了识别码等。因此又有原86版和调整后的86版两种编码。在官方网站上编码查询的结果,只会显示调整后的86版,然而坊间不少输入法软件仍采用原86版的编码,未经调整。
98版
98版是一种改进型的方案,于1998年推出,其编码的科学性更强、更易于学习和使用。使用259个码元,可处理GBK汉字集中的21003个简繁汉字。但二者在编码原则上大同小异。
新世纪版
新世纪版于2008年1月28日推出,采用新设计的字根体系更加匹配分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入更容易,可以处理GB 18030-2000汉字集中的27533个简繁汉字。
版本的使用情况
设计者认为,86版的字根设置不如98版和新世纪版科学。但是由于86版较先发布,且98版和新世纪版五笔字型编码的专利权尚掌握在王码公司手中,而王码公司反对其他公司在未授权的情况下开发和发行五笔字型输入法,因此86版五笔字型编码及相关软件的用户和输入法程序都比98版和新世纪版多。
从学习的角度看,有的人包括设计者在内的认为三个版本五笔相比较,86版较难学习,很多笔画多的字没有字根,导致很难拆分;也有的人认为由于86版较先发布,很多人已经掌握了86版的字根排布,很难再接受98版或新世纪版的五笔字根排布。
重码问题一直是困扰汉字输入法的一道难题,五笔字型一样会有重码。三个版本的重码相差不大,而新世纪版五笔在重码实用频度得到降低。
从字形上看,86版很多字都没有以简化字的字形出发,而以旧字形编码,造成很多字不按规则输入,形成特例字。98版已经较为改进这一类情况,使得输入此类字的时候能正确区分其左右,上下,外内等因素,但并没有根本解决此问题。
折的部分由于向右偏移,造成不顺手、不习惯。
86版过分在乎重码字,以规则去区分两个形近字,如(日与曰,未与末),但加入词组后,重码仍无法避免(尤、万、尢)。98版在修改字根排布之后较少出现这类情况。
86版设计的时候只适用于简化字,目前只有少数输入法支持五笔输入繁体字,而且繁体字输入在极少字根下十分困难,且大多是输单字时可直接用繁体编码,轮词组时则需要用简体字的编码,输入法会自动切换成对应的繁体词组。98版和新世纪版的更新中把一些拆分过量的字根和码元进行了集成,使之更容易支持繁体字。
输入软件
王码五笔输入软件
王码五笔型18030推出,是由于部分用户不适应98版,而又有输入更多汉字的需要而出现的。它基本延用86版的编码,而能处理GB 18030-2000字集的汉字,该字集可以处理27533个汉字。
王码大一统五笔字型输入法软件是现在的正式五笔字型输入法软件,安装包默认带有86、98和新世纪3个版本。
其它五笔输入软件
在王码五笔出现之后,又出现了许多其它的五笔输入法。由于86版编码的专利开放,它们大多采用86版的编码方式,但也有用户个人提供98或新世纪版编码的码表。它们在造词等功能上加以改进,也获得了一定的用户群。这其中也有一部分是以五笔编码形式为主的输入平台,它们不仅可以以五笔方式来输入,也可以根据用户的需求安装不同的码表以提供其它编码的输入方式。
常见的五笔输入法
极点五笔
QQ五笔输入法
搜狗五笔输入法
海峰五笔
万能五笔
奖项与应用
解决了汉字进入电脑的世界性难题,2008年1月8日,王码公司研发的“大一统五笔字型”获得国务院颁发的“国家科学技术发明奖”,成为唯一获此奖项的汉字输入法。
被联合国全面采用,是全世界唯一广泛应用的“汉字编码”输入技术。
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值