home.social

#五笔 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #五笔, aggregated by home.social.

  1. CW: 对比编码: 五笔字型、仓颉输入法的键名字、成字字根

    如有问题,请各位不吝批评、指正。谢谢!

    输入法 字根 键名字 成字字根
    五笔字型 234 25 75
    仓颉 114 24 13
    备注:
    成字字根只统计字频12041以内的汉字。
    键名字,实际也属于成字字根。
    纟: 五笔字型的键名字, 但不属于常用字频表内。

    五笔字型:键名字、成字字根
    序号 汉字 wubi86 cangjie5 常用字频表序号

    键名字
    1 王 ggg mg 131
    2 土 ffff g 520
    3 大 dd k 15
    4 木 ssss d 682
    5 工 a mlm 148

    6 目 hhhh bu 278
    7 日 jjjj a 67
    8 口 kkkk r 224
    9 田 lll w 714
    10 山 mmm u 180

    11 禾 ttt hd 3082
    12 白 rrr ha 259
    13 月 eee b 116
    14 人 w o 6
    15 金 qqqq c 206

    16 言 yyy ymmr 204
    17 立 uu yt 198
    18 水 ii e 191
    19 火 ooo f 431
    20 之 pp ino 13

    21 已 nnnn su 115
    22 子 bb nd 27
    23 女 vvv v 203
    24 又 ccc nk 93
    25 纟 xxx vvm

    成字字根
    1 戋 gggt ij 6763
    2 五 gg mdm 166
    3 一 g m 2
    4 士 fghg jm 269
    5 二 fg mm 72
    6 干 fggh mj 389
    7 十 fgh j 56
    8 寸 fghy di 1698
    9 雨 fghy meb 847
    10 犬 dgty ik 2557
    11 三 dg mmm 69
    12 古 dgh jr 453
    13 石 dgtg mr 368
    14 厂 dgt mh 1155
    15 丁 sgh mn 906
    16 西 sghg mcw 137
    17 戈 agnt i 1928
    18 弋 agny ip 4378
    19 廿 agh t 3865
    20 匚 agn mv 4375
    21 七 ag ju 353

    22 上 h ym 19
    23 止 hh ylm 565
    24 卜 hhy y 1866
    25 曰 jhng a 186
    26 早 jh aj 456
    27 虫 jhny lmi 1476
    28 川 kthh lll 1009
    29 甲 lhnh wl 858
    30 四 lh wc 144
    31 皿 lhn bt 4386
    32 车 lg kq 370
    33 力 lt ks 126
    34 由 mh lw 156
    35 贝 mhny bo 1269
    36 几 mt hn 228

    37 竹 ttg h 1496
    38 攵 ttgy ok 5069
    39 手 rt q 143
    40 斤 rtt hml 1946
    41 彡 ett hhh 6866
    42 乃 etn nhs 473
    43 用 et bq 57
    44 豕 egt msho 3829
    45 八 wty ho 321
    46 钅 qtgn omp 4849
    47 儿 qt lu 167
    48 夕 qtny ni 1746

    49 文 yygy xxyk 127
    50 方 yy yhs 63
    51 广 yygt yh 441
    52 辛 uygh ytj 1119
    53 六 uy yc 311
    54 门 uyh lis 151
    55 小 ih nc 70
    56 米 oy fd 688

    57 巳 nngn ru 1702
    58 己 nng su 171
    59 乙 nnl nu 1301
    60 尸 nngt s 1505
    61 心 ny p 90
    62 羽 nny smsim 1669
    63 孑 bnhg nnm 5399
    64 耳 bgh sj 809
    65 了 b nn 5
    66 也 bn pd 26
    67 刀 vn sh 1035
    68 九 vt kn 340
    69 臼 vth hx 3995
    70 巛 vnnn vvv 7791
    71 巴 cnh au 644
    72 马 cn nvsm 205
    73 弓 xng n 1962
    74 匕 xtn uh 3701
    75 幺 xnny vi 5173

    仓颉:键名字、成字字根
    序号 汉字 wubi86 cangjie5 常用字频表序号

    键名字
    1 日 jjjj a 67
    2 月 eee b 116
    3 金 qqqq c 206
    4 木 ssss d 682
    5 水 ii e 191
    6 火 ooo f 431
    7 土 ffff g 520

    8 竹 ttg h 1496
    9 戈 agnt i 1928
    10 十 fgh j 56
    11 大 dd k 15
    12 中 k l 18
    13 一 g m 2
    14 弓 xng n 1962

    15 人 w o 6
    16 心 ny p 90
    17 手 rt q 143
    18 口 kkkk r 224

    19 尸 nngt s 1505
    20 廿 agh t 3865
    21 山 mmm u 180
    22 女 vvv v 203
    23 田 lll w 714
    24 卜 hhy y 1866

    成字字根
    1 曰 jhng a 186
    2 八 wty ho 321
    3 又 ccc nk 93
    4 小 ih nc 70
    5 士 fghg jm 269

    6 广 yygt yh 441
    7 肀 vhk js 5861
    8 厂 dgt mh 1155
    9 工 a mlm 148
    10 乙 nnl nu 1301

    11 入 ty oh 169
    12 七 ag ju 353
    13 匕 xtn uh 3701


    总结取码规则:

    五笔字型
    1、最高频25个汉字, 只敲一码;
    2、键名字, 连敲键名四下, 某些键名字,同时属于一级或者二级简码,所以只敲一码或者二码;
    3、成字字根:键名码+首笔码+次笔码+末笔码;
    4、一般汉字:取一、二、三、末,共四码;
    5、不足四码, 增加末笔识别码。
    末笔识笔码: 最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来构成,劳心劳力。
    五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。

    仓颉
    1、键名字, 敲键名一下;
    2、成字字根: 按正常方式取码;
    3、整体字(连体字): 取一、二、三、尾码,最多四码;
    4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
    仓颉, 不会补充末笔识别码, 也不会重复取码。

    附录:
    汉字字频表/Chinese character frequency list
    lingua.mtsu.edu/chinese-comput
    有12041个汉字

    【五筆字型】輸入方案
    github.com/rime/rime-wubi
    有70391个汉字, 61205个词语。
    如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。

    倉頡三代補完計劃
    github.com/Arthurmcarthur/Cang

    倉頡五代補完計劃
    github.com/Jackchows/Cangjie5

    蒼頡檢字法〔Cangjie6〕
    github.com/lotem/rime-cangjie6

    #仓颉
    #倉頡
    #cangjie

    #五笔
    #wubi

    @board

  2. CW: 比较仓颉、五笔字型输入法

    君生我未生, 我生君已老。
    君恨我生迟, 我恨君生早。
    唐/无名氏

    曾经沧海难为水,除却巫山不是云。
    取次花丛懒回顾,半缘修道半缘君。
    唐/元稹

    “仓颉输入法原名形意检字法,是最早的电脑中文输入法,由朱邦复在1976年发明,属于形码输入法。”

    “五笔字型输入法(简称五笔、王码)是王永民在1983年8月发明的一种汉字输入法。因为发明人姓王,所以也称为“王码五笔”。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。”

    鄙人初学仓颉输入法,请各位不吝批评、指正。谢谢!

    一、字根

    五笔字型86版:234个;
    仓颉五代: 114个。

    二、取码规则:

    五笔字型:
    “书写顺序、取大优先、兼顾直观、能连不交、能散不连。”

    五笔字型,按书写顺序取码, 实际是作茧自缚。
    因为各人书写习惯不同, 必然导致打字不断出错。
    例如:“戈、我”之类的汉字, 根据网络资料, 有的最后一笔是“撇/丿”, 有的最后一笔是:“点/丶” 。
    鄙人习惯是写完斜钩, 再写斜钩上的一撇, 最后写一点。

    有人担心如果不按笔顺取码, 会造成写字混乱, 这是杞人忧天。
    古往今来, 人们的书写工具变了很多:刀、毛笔、铅笔、钢笔、圆珠笔等等。
    其实, 只要把电脑打字, 看成一种书写工具就好了。
    再说, 无论是拼音打字, 还是五笔、仓颉打字, 人们向电脑输入的都是英文字母。
    可是, 并没有人因此手写汉字时, 把汉字写成英文字母。
    说字形码会造成手写汉字混乱, 其实是危言耸听。

    “目", 仓颉码:月山/BU。
    仓颉输入法, 将“目"字拆分为“月”+“凵”,人们手写“目”字时,不会真的将“目”字断开来写, 而是怎么方便就怎么写。

    仓颉:
    完整原则:保留字形特征;
    省略原则:部分省略、包含省略。

    “一刀分两半”。

    不能分割, 整体字(连体字), 取一、二、三、尾码, 最多取四码。

    可以分割, 组合字(分体字), 分为字首、字身,合计最多五码。
    字首,取一、尾码,最多两码。
    字身,最多三码。

    字身, 为整体字(连体字), 取一、二、尾码。
    字身, 为组合字(分体字), 再分为次字首、次字身。
    次字首,取一码, 或者一、尾码;
    次字身,取一、尾码, 或者尾码。

    无论仓颉, 还是五笔, 一个汉字与单笔画相连、相交,都有可能改这个汉字的结构类型(仓颉:连体、分体; 五笔:左右、上下、杂合)。
    可是,五笔字型,有时不足四码,要考虑字型结构,费心费力。
    也就是, 不足四码时, 要看最后一个笔画的类别(横、竖、撇、捺、折), 与整个字的结构类型(左右、上下、杂合), 组合起来,构成一个末笔识笔码。
    但是, 大脑取得末笔识别码, 实在是需要经过大量计算,劳心劳力。

    仓颉是首先对汉字砍一刀,
    不能分割, 连体字;
    能分割,分体字,然后对字首、字身(次字首、次字身)分别按规则取码。
    首先看到森林:分为连体字、分体字;
    然后再看树木:对汉字的各个零件分别取码,再合并组成仓颉编码。

    “相同的字首或字身, 其字码固定。”
    来源:《第五代倉頡輸入法手冊》第62页。

    三、例外字:

    五笔字型的例外字, 需要自己打字时, 不断总结。

    仓颉所有的例外字,在《第五代倉頡輸入法手冊》第85页开始列明, 在以下网页,已经全部列出。
    而且例外字, 实际成为一个大字根, 可以和其他汉字再组合成字。

    倉頡輸入法/例外字
    zh.wikibooks.org/wiki/%E5%80%8

    四、成字字根

    五笔
    键名汉字的编码: 连敲所在键的字母四次。
    (一级简码:根据每一键位上的字根形态,每键安排一个最常用的高频汉字,这类字只需打一键即可。)

    成字字根汉字的编码规则:键名码+首笔码+次笔码+末笔码。
    例如:
    戈/A: AGNT(工 + 横 + 斜钩 + 撇);
    士/F: FGHG(土 + 横 + 竖 + 横)。

    猜想:
    成字字根汉字的编码规则,
    如果改为笔画一、二、三、末笔码, 难度与现在一样。
    如果改为像仓颉一样,按正常方式取码,一些可以用其他字根(非单纯笔画)组成, 一些只能用单纯笔画, 一笔一笔的组成。

    结论:五笔字型的字根集合, 决定了它现在的成字字根编码方式。
    也就是五笔字型有许多大字根, 是由其他小字根组成。
    仓颉五代, 除了键名字根24个之外, 还有90个字根, 相应的成字字根数量很少。
    仓颉五代, 只有少数几个大字根, 是由其他小字根组成。
    所谓小字根,至少由两笔组成,不包含只有一笔单纯基本笔画的字根。
    因为可以说所有的字根都是由五个基本笔画(横、竖、撇、捺、折)组成, 那样说了等于没说, 没有意义。

    仓颉
    键名代表字: 敲所在键一次。
    成字字根汉字的编码规则: 按正常方式取码。
    例如:
    工/M: 一中一/MLM(横+纵+横);
    士/G: 十一/JM(交+横)。

    有些单笔画、多笔画, 与键名代表字一样, 只取一码。
    例如: 一、丨、丿、丶, 亅、乂、㐅, 都只取一码。

    对比两种输入法,就可以知道, 五笔字型的成字字根之取码规则, 实际就是重复取码, 重复取了键名码,而且增加了大脑记忆量。

    五、总结取码规则:

    五笔字型
    1、最高频25个汉字, 只敲一码;
    2、键名字, 连敲键名四下;
    3、成字字根:键名码+首笔码+次笔码+末笔码;
    4、一般汉字:取一、二、三、末,共四码;
    5、不足四码, 增加末笔识别码。

    仓颉:
    1、键名字, 敲键名一下;
    2、成字字根: 按正常方式取码;
    3、整体字(连体字): 取一、二、三、尾码,最多四码;
    4、组合字(分体字):字首, 取一、尾, 最多两码; 字身(次字首、次字身), 最多三码, 合计最多五码。
    仓颉, 不会补充末笔识别码, 也不会重复取码。

    六、重码率
    超出8105个简体常用汉字范围,五笔字型重码率远远大于仓颉。
    如果统计70391个汉字, 五笔字型重码率是48.51%, 仓颉为28.03%。

    输入法 汉字范围 重码数量 重码率
    cangjie5 3500 130 3.71%
    wubi86 3500 46 1.31%

    cangjie5 6500 336 5.17%
    wubi86 6500 216 3.32%

    cangjie5 8105 486 6.00%
    wubi86 8105 437 5.39%

    cangjie5 12041 847 7.03%
    wubi86 12041 1685 13.99%

    cangjie5 16361 1488 9.09%
    wubi86 16361 3081 18.83%

    cangjie5 70391 19734 28.03%
    wubi86 70391 34147 48.51%

    五笔字型,下列汉字全部重码,
    仓颉输入法, 下列汉字全部唯一编码。
    贝/赢,羊/羸,女/嬴,虫/蠃,果/臝,馬/驘,貝/贏,鳥/鸁

    当然, 不能以仓颉之长攻五笔之短。
    肯定有仓颉重码, 而五笔不重码的情况。

    但是, 从整体来看, 五笔重码率远远大于仓颉, 是因为双方不同的字根、编码规则造成。
    也就是说,重码率高,是五笔字型输入法的先天规则缺陷。

    对比, 才知道两种输入法, 谁优谁劣。
    怪不得有人说:吃过荔枝, 才知道生李子苦涩。

    七、总结:
    拼音输入法, 如果联网, 则侵犯隐私。
    联想、提示词语, 其实也是一种变相的八股、教条、可能会限制人的自由思考。

    五笔字型,要求遵守笔顺, 是作茧自缚。
    字根多, 规则繁, 记忆量大。
    学习, 或者重新学习的成本高。

    仓颉输入法, 不按笔順,按视觉,”一刀分两半“,拆分汉字。
    规则简单明瞭, 像拆积木一样拆码。
    打字变成了游戏, 十分好玩。
    学习, 或者重新学习的成本低。
    所以, 鄙人使用仓颉输入法, 不打词语, 只打单个汉字, 自由组合汉字。

    小时候, 联网的拼音输入法,已经是一统天下, 但是家人让我学习五笔字型86版输入法。
    电脑中有仓颉输入法, 不知道当时为什么没有去学习?
    因为是台湾人发明的, 因为没有教材,因为没有人引导……
    还好这次没有当面错过, 没有入宝山,空手而返。

    子曰:“朝闻道,夕死可矣。”
    论语/里仁篇第四

    附录:

    汉字字频表/Chinese character frequency list
    lingua.mtsu.edu/chinese-comput
    有12041个汉字

    常见汉字字表和字符集
    github.com/zispace/hanzi-chars

    小學程度漢字
    hkcards.com/cj/list-primary-sc

    常用字表一
    hkcards.com/cj/list-common

    汇总以上中国、香港、台湾常用字集, 得到16361个汉字。

    【五筆字型】輸入方案
    github.com/rime/rime-wubi
    有70391个汉字, 61205个词语。
    如果喜欢五笔字型86版输入法, 上面链接中的字表(wubi86.dict.yaml)已经够用了。

    倉頡三代補完計劃
    github.com/Arthurmcarthur/Cang

    倉頡五代補完計劃
    github.com/Jackchows/Cangjie5

    蒼頡檢字法〔Cangjie6〕
    github.com/lotem/rime-cangjie6

    #仓颉
    #倉頡
    #cangjie

    #五笔
    #wubi

    @board

  3. CW: 劝退:如何学习五笔字型输入法86版

    “取法乎上,仅得乎中; 取法乎中, 仅得乎下。”

    论诗五首, 其二
    李杜诗篇万口传, 至今已觉不新鲜。
    江山代有才人出, 各领风骚数百年。
    赵翼/清代

    劝退。

    建议直接学习:仓颉输入法。
    仓颉输入法, 不仅可以输出正体字(繁体字), 也可以输出简体字, 而且开源、免费。

    仓颉输入法/倉頡輸入法/cangjie
    zh.wikibooks.org/wiki/%E5%80%8

    五笔字型86版(234个字根)、仓颉五代(114个字形), 两种输入法的字形(字根)在同一个键位的是, N: 乙, V: 女, Y: 亠,共计三个, 也就是两种输入法,绝大多数相同的字形(字根)键位不同,会互相干扰人的思维。
    我初学仓颉输入法时,多次看到“横”(一/M), 手却敲击五笔字型的键位:G(一); 看到“日”(A), 手却敲击五笔字型的键位:J(日), 诸如此类。
    当然,主要原因还是我仓颉输入法的字母、字形(字根)记得不牢固。

    五笔字型规定了笔顺,仓颉无关笔顺。
    因为笔顺,各人习惯不同,谁正确?
    最后必然是谁拳头大,谁就正确。

    所以为了避免五笔字型输入法的负面干扰,建议直接学习:仓颉输入法。

    曾经五笔字型输入法占据中国输入法的绝大部分市场份额。
    但是,现在是各种智能、联想、联网的拼音输入法垄断市场。

    现在,谁还在使用五笔字型输法?
    银行等保密要求高的公司、机关、单位。
    因为那些智能、联想、联网的拼音输入法, 包括联网的(搜狗、QQ、百度)五笔字型输入法,都会上传用户输入的所有资料。
    所以,银行等公司、机关、单位使用:不联网的五笔字型输入法。

    因为86版是公开、免费版,各大操作系统默认安装。
    如果学习98版、或者新世纪版,都需要专门购买软件。
    所以,如果一定要学习五笔字型输入法,建议学习86版。

    如何学习五笔字型输入法86版

    一、
    熟记五笔字型字根
    抄写,背诵字根。
    练习输入字根,首先按横、竖、撇、捺、折五个笔画,分区练习,然后把所有234个字根合并练习。

    二、
    学习五笔字型编码拆分规则:“书写顺序、取大优先、兼顾直观、能连不交、能散不连”。
    来源:《打字高手 五笔字型高速录入秘诀》 (王永民,陈云峰编著)第5页。
    反复阅读、理解, 并且练习例字。
    最初没有“书写顺序”这条规格,因为被中国教育部批评乱拆字,所以加了这条规则。

    三、
    专门练习拆分疑难字
    许多五笔字型的书,有专门的章节介绍如何拆分疑难部首、疑难汉字, 从 z-lib 下载几本书,反复练习。
    用记事本专门记录经常打错、忘记如何拆分的汉字。

    例如:
    《巧学巧用五笔字型》
    第17页: 末笔字型识别码,
    将6763个汉字中,需要末笔识别码的字列出, 可以专门训练。

    《五笔字型学习大礼包之五笔字型快译通速查字典》
    附录1: 五笔字型难拆汉字速查表
    附录3: 易拆错汉字速查表

    《五笔字型完全自学手册双色版》
    附录B 常见非基本字根拆分

    四、
    练习一级简码、二级简码、三级简码

    五、
    练习拆分常用汉字。

    六、
    平常使用五笔字型输入法写文章, 巩固熟练。

    批评:
    1、
    五笔字型中的“牛、牧”, 拆分规则不一样, 也就是“牛”当独作为汉字,与作为偏旁的“牛”字,拆分字根不同。这一点使人困惑。

    2、
    “禾”字系列,规则也不一样:“秉, 乘, 剩”。 以前“秉”也可以拆分出完整的“禾”字根,后来改为“撇、横、折、捺/TGVI”, 但是, “乘、剩”, 是可以拆分出完整的“禾”字根, 即标准不统一。

    3、
    “刀、九、匕、力、乃”作为汉字的最后一个字根时,其末笔识别码统一规定为“乙”(折)。
    但是,当“刀”字单独作为一个汉字时,末笔为“丿”(撇),编码为VNT。
    这些字的五笔字型86版编码如下:
    刀: VNT;
    九: VTN,匕: XTN,力: LTN,乃: ETN,
    也就是依赖笔顺,需要特别记忆。

    4、
    乡:XTE, 末笔识别码,杂合型; 少: ITR, 末笔识别码,上下型。
    乡、少, 都是一个字根与单笔画组合,末笔识码, 一个是杂合型, 一个是上下型,即标准不统一。
    “一个基本字根与一个单笔画相连,也视为杂合型结构。”
    来源:《“打”出速度 五笔字型输入法过目不忘》 (李飞创作工作室编著)第66页。
    另外可以参看: 电脑通用汉字输入法 五笔字型 《培训教材》(王永民、张一平编著)第30页。

    附录,五笔字型86版字根记忆口诀:

    G: 王旁青头戋(兼)五一,
    F: 土士二干十寸雨,还有革字底,
    D: 大犬三羊古石厂,
    S: 木丁西,
    A: 工戈草头右框七。

    H: 目具上止卜虎皮,
    J: 日早两竖与虫依,
    K: 口与川,字根稀,
    L: 田甲方框四车力,
    M: 山由贝,下框几。

    T: 禾竹一撇双人立,反文条头共三一,
    R: 白手看头三二斤,
    E: 月彡(衫)乃用家衣底,
    W: 人和八,三四里,登祭头,
    Q: 金勺缺点无尾鱼,犬旁留叉儿一点夕,氏无七。

    Y: 言文方广在四一, 高头一捺谁人去,
    U: 立辛两点六门病,
    I: 水旁兴头小倒立,
    O: 火业头,四点米,
    P: 之字军盖建字底, 摘礻(示)衤(衣)。

    N: 已半巳满不出己, 左框折尸心和羽,
    B: 子耳了也框向上,
    V: 女刀九臼山朝西,
    C: 又巴马,丢矢矣,
    X: 慈母无心弓和匕, 幼无力。

    #五笔
    #wubi86

    #仓颉
    #倉頡
    #cangjie

    @board