#五笔 — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #五笔, aggregated by home.social.
-
CW: 对比编码: 五笔字型、仓颉输入法的键名字、成字字根
如有问题,请各位不吝批评、指正。谢谢!
输入法 字根 键名字 成字字根
五笔字型 234 25 75
仓颉 114 24 13
备注:
成字字根只统计字频12041以内的汉字。
键名字,实际也属于成字字根。
纟: 五笔字型的键名字, 但不属于常用字频表内。五笔字型:键名字、成字字根
序号 汉字 wubi86 cangjie5 常用字频表序号键名字
1 王 ggg mg 131
2 土 ffff g 520
3 大 dd k 15
4 木 ssss d 682
5 工 a mlm 1486 目 hhhh bu 278
7 日 jjjj a 67
8 口 kkkk r 224
9 田 lll w 714
10 山 mmm u 18011 禾 ttt hd 3082
12 白 rrr ha 259
13 月 eee b 116
14 人 w o 6
15 金 qqqq c 20616 言 yyy ymmr 204
17 立 uu yt 198
18 水 ii e 191
19 火 ooo f 431
20 之 pp ino 1321 已 nnnn su 115
22 子 bb nd 27
23 女 vvv v 203
24 又 ccc nk 93
25 纟 xxx vvm成字字根
1 戋 gggt ij 6763
2 五 gg mdm 166
3 一 g m 2
4 士 fghg jm 269
5 二 fg mm 72
6 干 fggh mj 389
7 十 fgh j 56
8 寸 fghy di 1698
9 雨 fghy meb 847
10 犬 dgty ik 2557
11 三 dg mmm 69
12 古 dgh jr 453
13 石 dgtg mr 368
14 厂 dgt mh 1155
15 丁 sgh mn 906
16 西 sghg mcw 137
17 戈 agnt i 1928
18 弋 agny ip 4378
19 廿 agh t 3865
20 匚 agn mv 4375
21 七 ag ju 35322 上 h ym 19
23 止 hh ylm 565
24 卜 hhy y 1866
25 曰 jhng a 186
26 早 jh aj 456
27 虫 jhny lmi 1476
28 川 kthh lll 1009
29 甲 lhnh wl 858
30 四 lh wc 144
31 皿 lhn bt 4386
32 车 lg kq 370
33 力 lt ks 126
34 由 mh lw 156
35 贝 mhny bo 1269
36 几 mt hn 22837 竹 ttg h 1496
38 攵 ttgy ok 5069
39 手 rt q 143
40 斤 rtt hml 1946
41 彡 ett hhh 6866
42 乃 etn nhs 473
43 用 et bq 57
44 豕 egt msho 3829
45 八 wty ho 321
46 钅 qtgn omp 4849
47 儿 qt lu 167
48 夕 qtny ni 174649 文 yygy xxyk 127
50 方 yy yhs 63
51 广 yygt yh 441
52 辛 uygh ytj 1119
53 六 uy yc 311
54 门 uyh lis 151
55 小 ih nc 70
56 米 oy fd 68857 巳 nngn ru 1702
58 己 nng su 171
59 乙 nnl nu 1301
60 尸 nngt s 1505
61 心 ny p 90
62 羽 nny smsim 1669
63 孑 bnhg nnm 5399
64 耳 bgh sj 809
65 了 b nn 5
66 也 bn pd 26
67 刀 vn sh 1035
68 九 vt kn 340
69 臼 vth hx 3995
70 巛 vnnn vvv 7791
71 巴 cnh au 644
72 马 cn nvsm 205
73 弓 xng n 1962
74 匕 xtn uh 3701
75 幺 xnny vi 5173仓颉:键名字、成字字根
序号 汉字 wubi86 cangjie5 常用字频表序号键名字
1 日 jjjj a 67
2 月 eee b 116
3 金 qqqq c 206
4 木 ssss d 682
5 水 ii e 191
6 火 ooo f 431
7 土 ffff g 5208 竹 ttg h 1496
9 戈 agnt i 1928
10 十 fgh j 56
11 大 dd k 15
12 中 k l 18
13 一 g m 2
14 弓 xng n 196215 人 w o 6
16 心 ny p 90
17 手 rt q 143
18 口 kkkk r 22419 尸 nngt s 1505
20 廿 agh t 3865
21 山 mmm u 180
22 女 vvv v 203
23 田 lll w 714
24 卜 hhy y 1866成字字根
1 曰 jhng a 186
2 八 wty ho 321
3 又 ccc nk 93
4 小 ih nc 70
5 士 fghg jm 2696 广 yygt yh 441
7 肀 vhk js 5861
8 厂 dgt mh 1155
9 工 a mlm 148
10 乙 nnl nu 130111 入 ty oh 169
12 七 ag ju 353
13 匕 xtn uh 3701
总结取码规则:五笔字型
1、最高频25个汉字, 只敲一码;
2、键名字, 连敲键名四下, 某些键名字,同时属于一级或者二级简码,所以只敲一码或者二码;
3、成字字根:键名码+首笔码+次笔码+末笔码;
4、一般汉字:取一、二、三、末,共四码;
5、不足四码, 增加末笔识别码。
末笔识笔码: 最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来构成,劳心劳力。
五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。仓颉
1、键名字, 敲键名一下;
2、成字字根: 按正常方式取码;
3、整体字(连体字): 取一、二、三、尾码,最多四码;
4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
仓颉, 不会补充末笔识别码, 也不会重复取码。附录:
汉字字频表/Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php
有12041个汉字【五筆字型】輸入方案
https://github.com/rime/rime-wubi
有70391个汉字, 61205个词语。
如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6 -
CW: 比较仓颉、五笔字型输入法
君生我未生, 我生君已老。
君恨我生迟, 我恨君生早。
唐/无名氏曾经沧海难为水,除却巫山不是云。
取次花丛懒回顾,半缘修道半缘君。
唐/元稹“仓颉输入法原名形意检字法,是最早的电脑中文输入法,由朱邦复在1976年发明,属于形码输入法。”
“五笔字型输入法(简称五笔、王码)是王永民在1983年8月发明的一种汉字输入法。因为发明人姓王,所以也称为“王码五笔”。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。”
鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!
一、字根
五笔字型86版:234个;
仓颉五代: 114个。二、取码规则:
五笔字型:
“书写顺序、取大优先、兼顾直观、能连不交、能散不连。”五笔字型,按书写顺序取码, 实际是作茧自缚。
因为各人书写习惯不同, 必然导致打字不断出错。
例如:“戈、我”之类的汉字, 根据网络资料, 有的最后一笔是“撇/丿”, 有的最后一笔是:“点/丶” 。
鄙人习惯是写完斜钩, 再写斜钩上的一撇, 最后写一点。有人担心如果不按笔顺取码, 会造成写字混乱, 这是杞人忧天。
古往今来, 人们的书写工具变了很多:刀、毛笔、铅笔、钢笔、圆珠笔等等。
其实, 只要把电脑打字, 看成一种书写工具就好了。
再说, 无论是拼音打字, 还是五笔、仓颉打字, 人们向电脑输入的都是英文字母。
可是, 并没有人因此手写汉字时, 把汉字写成英文字母。
说字形码会造成手写汉字混乱, 其实是危言耸听。“目", 仓颉码:月山/BU。
仓颉输入法, 将“目"字拆分为“月”+“凵”,人们手写“目”字时,不会真的将“目”字断开来写, 而是怎么方便就怎么写。仓颉:
完整原则:保留字形特征;
省略原则:部分省略、包含省略。“一刀分两半”。
不能分割, 整体字(连体字), 取一、二、三、尾码, 最多取四码。
可以分割, 组合字(分体字), 分为字首、字身,合计最多五码。
字首,取一、尾码,最多两码。
字身,最多三码。字身, 为整体字(连体字), 取一、二、尾码。
字身, 为组合字(分体字), 再分为次字首、次字身。
次字首,取一码, 或者一、尾码;
次字身,取一、尾码, 或者尾码。无论仓颉, 还是五笔, 一个汉字与单笔画相连、相交,都有可能改这个汉字的结构类型(仓颉:连体、分体; 五笔:左右、上下、杂合)。
可是,五笔字型,有时不足四码,要考虑字型结构,费心费力。
也就是, 不足四码时, 要看最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来,构成一个末笔识笔码。
但是, 大脑取得末笔识别码, 实在是需要经过大量计算,劳心劳力。仓颉是首先对汉字砍一刀,
不能分割, 连体字;
能分割,分体字,然后对字首、字身(次字首、次字身)分别按规则取码。
首先看到森林:分为连体字、分体字;
然后再看树木:对汉字的各个零件分别取码,再合并组成仓颉编码。“相同的字首或字身, 其字码固定。”
来源:《第五代倉頡輸入法手冊》第62页。三、例外字:
五笔字型的例外字, 需要自己打字时, 不断总结。
仓颉所有的例外字,在《第五代倉頡輸入法手冊》第85页开始列明, 在以下网页,已经全部列出。
而且例外字, 实际成为一个大字根, 可以和其他汉字再组合成字。四、成字字根
五笔
键名汉字的编码: 连敲所在键的字母四次。
(一级简码:根据每一键位上的字根形态,每键安排一个最常用的高频汉字,这类字只需打一键即可。)成字字根汉字的编码规则:键名码+首笔码+次笔码+末笔码。
例如:
戈/A: AGNT(工 + 横 + 斜钩 + 撇);
士/F: FGHG(土 + 横 + 竖 + 横)。猜想:
成字字根汉字的编码规则,
如果改为笔画一、二、三、末笔码, 难度与现在一样。
如果改为像仓颉一样,按正常方式取码,一些可以用其他字根(非单纯笔画)组成, 一些只能用单纯笔画, 一笔一笔的组成。结论:五笔字型的字根集合, 决定了它现在的成字字根编码方式。
也就是五笔字型有许多大字根, 是由其他小字根组成。
仓颉五代, 除了键名字根24个之外, 还有90个字根, 相应的成字字根数量很少。
仓颉五代, 只有少数几个大字根, 是由其他小字根组成。
所谓小字根,至少由两笔组成,不包含只有一笔单纯基本笔画的字根。
因为可以说所有的字根都是由五个基本笔画(横、竖、撇、捺、折)组成, 那样说了等于没说, 没有意义。仓颉
键名代表字: 敲所在键一次。
成字字根汉字的编码规则: 按正常方式取码。
例如:
工/M: 一中一/MLM(横+纵+横);
士/G: 十一/JM(交+横)。有些单笔画、多笔画, 与键名代表字一样, 只取一码。
例如: 一、丨、丿、丶, 亅、乂、㐅, 都只取一码。对比两种输入法,就可以知道, 五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。
五、总结取码规则:
五笔字型
1、最高频25个汉字, 只敲一码;
2、键名字, 连敲键名四下;
3、成字字根:键名码+首笔码+次笔码+末笔码;
4、一般汉字:取一、二、三、末,共四码;
5、不足四码, 增加末笔识别码。仓颉:
1、键名字, 敲键名一下;
2、成字字根: 按正常方式取码;
3、整体字(连体字): 取一、二、三、尾码,最多四码;
4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
仓颉, 不会补充末笔识别码, 也不会重复取码。六、重码率
超出8105个简体常用汉字范围,五笔字型重码率远远大于仓颉。
如果统计70391个汉字, 五笔字型重码率是48.51%, 仓颉为28.03%。输入法 汉字范围 重码数量 重码率
cangjie5 3500 130 3.71%
wubi86 3500 46 1.31%
cangjie5 6500 336 5.17%
wubi86 6500 216 3.32%
cangjie5 8105 486 6.00%
wubi86 8105 437 5.39%
cangjie5 12041 847 7.03%
wubi86 12041 1685 13.99%
cangjie5 16361 1488 9.09%
wubi86 16361 3081 18.83%
cangjie5 70391 19734 28.03%
wubi86 70391 34147 48.51%五笔字型,下列汉字全部重码,
仓颉输入法, 下列汉字全部唯一编码。
贝/赢,羊/羸,女/嬴,虫/蠃,果/臝,馬/驘,貝/贏,鳥/鸁当然, 不能以仓颉之长攻五笔之短。
肯定有仓颉重码, 而五笔不重码的情况。但是, 从整体来看, 五笔重码率远远大于仓颉, 是因为双方不同的字根、编码规则造成。
也就是说,重码率高,是五笔字型输入法的先天规则缺陷。对比, 才知道两种输入法, 谁优谁劣。
怪不得有人说:吃过荔枝, 才知道生李子苦涩。七、总结:
拼音输入法, 如果联网, 则侵犯隐私。
联想、提示词语, 其实也是一种变相的八股、教条、可能会限制人的自由思考。五笔字型,要求遵守笔顺, 是作茧自缚。
字根多, 规则繁, 记忆量大。
学习, 或者重新学习的成本高。仓颉输入法, 不按笔順,按视觉,”一刀分两半“,拆分汉字。
规则简单明瞭, 像拆积木一样拆码。
打字变成了游戏, 十分好玩。
学习, 或者重新学习的成本低。
所以, 鄙人使用仓颉输入法, 不打词语, 只打单个汉字, 自由组合汉字。小时候, 联网的拼音输入法,已经是一统天下, 但是家人让我学习五笔字型86版输入法。
电脑中有仓颉输入法, 不知道当时为什么没有去学习?
因为是台湾人发明的, 因为没有教材,因为没有人引导……
还好这次没有当面错过, 没有入宝山,空手而返。子曰:“朝闻道,夕死可矣。”
论语/里仁篇第四附录:
汉字字频表/Chinese character frequency list
https://lingua.mtsu.edu/chinese-computing/statistics/char/list.php
有12041个汉字常见汉字字表和字符集
https://github.com/zispace/hanzi-chars/releases小學程度漢字
https://www.hkcards.com/cj/list-primary-school-level常用字表一
https://www.hkcards.com/cj/list-common汇总以上中国、香港、台湾常用字集, 得到16361个汉字。
【五筆字型】輸入方案
https://github.com/rime/rime-wubi
有70391个汉字, 61205个词语。
如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。倉頡三代補完計劃
https://github.com/Arthurmcarthur/Cangjie3-Plus倉頡五代補完計劃
https://github.com/Jackchows/Cangjie5蒼頡檢字法〔Cangjie6〕
https://github.com/lotem/rime-cangjie6 -
CW: 劝退:如何学习五笔字型输入法86版
“取法乎上,仅得乎中; 取法乎中, 仅得乎下。”
论诗五首, 其二
李杜诗篇万口传, 至今已觉不新鲜。
江山代有才人出, 各领风骚数百年。
赵翼/清代劝退。
建议直接学习:仓颉输入法。
仓颉输入法, 不仅可以输出正体字(繁体字), 也可以输出简体字, 而且开源、免费。仓颉输入法/倉頡輸入法/cangjie
https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95五笔字型86版(234个字根)、仓颉五代(114个字形), 两种输入法的字形(字根)在同一个键位的是, N: 乙, V: 女, Y: 亠,共计三个, 也就是两种输入法,绝大多数相同的字形(字根)键位不同,会互相干扰人的思维。
我初学仓颉输入法时,多次看到“横”(一/M), 手却敲击五笔字型的键位:G(一); 看到“日”(A), 手却敲击五笔字型的键位:J(日), 诸如此类。
当然,主要原因还是我仓颉输入法的字母、字形(字根)记得不牢固。五笔字型规定了笔顺,仓颉无关笔顺。
因为笔顺,各人习惯不同,谁正确?
最后必然是谁拳头大,谁就正确。所以为了避免五笔字型输入法的负面干扰,建议直接学习:仓颉输入法。
曾经五笔字型输入法占据中国输入法的绝大部分市场份额。
但是,现在是各种智能、联想、联网的拼音输入法垄断市场。现在,谁还在使用五笔字型输法?
银行等保密要求高的公司、机关、单位。
因为那些智能、联想、联网的拼音输入法, 包括联网的(搜狗、QQ、百度)五笔字型输入法,都会上传用户输入的所有资料。
所以,银行等公司、机关、单位使用:不联网的五笔字型输入法。因为86版是公开、免费版,各大操作系统默认安装。
如果学习98版、或者新世纪版,都需要专门购买软件。
所以,如果一定要学习五笔字型输入法,建议学习86版。如何学习五笔字型输入法86版
一、
熟记五笔字型字根
抄写,背诵字根。
练习输入字根,首先按横、竖、撇、捺、折五个笔画,分区练习,然后把所有234个字根合并练习。二、
学习五笔字型编码拆分规则:“书写顺序、取大优先、兼顾直观、能连不交、能散不连”。
来源:《打字高手 五笔字型高速录入秘诀》 (王永民,陈云峰编著)第5页。
反复阅读、理解, 并且练习例字。
最初没有“书写顺序”这条规格,因为被中国教育部批评乱拆字,所以加了这条规则。三、
专门练习拆分疑难字
许多五笔字型的书,有专门的章节介绍如何拆分疑难部首、疑难汉字, 从 z-lib 下载几本书,反复练习。
用记事本专门记录经常打错、忘记如何拆分的汉字。例如:
《巧学巧用五笔字型》
第17页: 末笔字型识别码,
将6763个汉字中,需要末笔识别码的字列出, 可以专门训练。《五笔字型学习大礼包之五笔字型快译通速查字典》
附录1: 五笔字型难拆汉字速查表
附录3: 易拆错汉字速查表《五笔字型完全自学手册双色版》
附录B 常见非基本字根拆分四、
练习一级简码、二级简码、三级简码五、
练习拆分常用汉字。六、
平常使用五笔字型输入法写文章, 巩固熟练。批评:
1、
五笔字型中的“牛、牧”, 拆分规则不一样, 也就是“牛”当独作为汉字,与作为偏旁的“牛”字,拆分字根不同。这一点使人困惑。2、
“禾”字系列,规则也不一样:“秉, 乘, 剩”。 以前“秉”也可以拆分出完整的“禾”字根,后来改为“撇、横、折、捺/TGVI”, 但是, “乘、剩”, 是可以拆分出完整的“禾”字根, 即标准不统一。3、
“刀、九、匕、力、乃”作为汉字的最后一个字根时,其末笔识别码统一规定为“乙”(折)。
但是,当“刀”字单独作为一个汉字时,末笔为“丿”(撇),编码为VNT。
这些字的五笔字型86版编码如下:
刀: VNT;
九: VTN,匕: XTN,力: LTN,乃: ETN,
也就是依赖笔顺,需要特别记忆。4、
乡:XTE, 末笔识别码,杂合型; 少: ITR, 末笔识别码,上下型。
乡、少, 都是一个字根与单笔画组合,末笔识码, 一个是杂合型, 一个是上下型,即标准不统一。
“一个基本字根与一个单笔画相连,也视为杂合型结构。”
来源:《“打”出速度 五笔字型输入法过目不忘》 (李飞创作工作室编著)第66页。
另外可以参看: 电脑通用汉字输入法 五笔字型 《培训教材》(王永民、张一平编著)第30页。附录,五笔字型86版字根记忆口诀:
G: 王旁青头戋(兼)五一,
F: 土士二干十寸雨,还有革字底,
D: 大犬三羊古石厂,
S: 木丁西,
A: 工戈草头右框七。H: 目具上止卜虎皮,
J: 日早两竖与虫依,
K: 口与川,字根稀,
L: 田甲方框四车力,
M: 山由贝,下框几。T: 禾竹一撇双人立,反文条头共三一,
R: 白手看头三二斤,
E: 月彡(衫)乃用家衣底,
W: 人和八,三四里,登祭头,
Q: 金勺缺点无尾鱼,犬旁留叉儿一点夕,氏无七。Y: 言文方广在四一, 高头一捺谁人去,
U: 立辛两点六门病,
I: 水旁兴头小倒立,
O: 火业头,四点米,
P: 之字军盖建字底, 摘礻(示)衤(衣)。N: 已半巳满不出己, 左框折尸心和羽,
B: 子耳了也框向上,
V: 女刀九臼山朝西,
C: 又巴马,丢矢矣,
X: 慈母无心弓和匕, 幼无力。