说说小鹤与自然码
小鹤双拼吧
全部回复
仅看楼主
level 11
散步de鹤 楼主
一楼留给百度,稍后测试资料会放在置顶帖的网盘空间。
2014年08月29日 09点08分 1
level 11
散步de鹤 楼主
其实本来不想说这个话题的,因为某个所谓编码专家编了个单字码,就时时的拿单字来和人赛码,最近更扯出了小鹤与自然码。为了正视听,就拿同一篇赛文来测得一结果,并分析之,以供想了解两者编码差异的朋友参考。
一、先简单介绍一下两个的编码方案:
共同点:均为单字全码四码(前两码双拼,后两码双形)的音形方案;形均为以音托形,即形字根的键位是以此字根声母所在键来定的,非成字字根另定。
差异:①两者双拼方案不同;
②双形字根取向不同:
自然码字根偏向取大字根,如:树 木对、据 扌居、题 是页
小鹤字根偏向取小字根,如:树 木寸、据 扌口、题 日人
自然码字根是部首优先取,如:部 阝咅、盘 皿舟、赏 贝口
小鹤字根是顺序取,如:部 立阝、盘 舟皿、赏 人
还有的字因为本身拆分字根既是大也是小,所以两者取形虽相同,内涵却是不同的,如:舌 千口、夯 大力、朵 几木
③GB2312字集6763字含多音字,单字全码重码数不同:
自然码重码2900余字,如果以均为二重码论,相当于有1500字是处于重码位的,即使按有简无全的方式来设计码表,也会有大量的23重码
小鹤重码800余字,如果以均为二重码论,相当于有400字是处于重码位的,
按有简无全的方式来设计码表,只有少量的二重码
(以上自然码数据根据自然码论坛相关码表统计而得)
2014年08月29日 09点08分 2
小鹤字根是顺序取首末,纠正一下。
2014年08月29日 12点08分
回复 散步de鹤 :赏 字的首字根,百度吧显示不出来,是 竖点撇 组合。
2014年08月29日 12点08分
用6763比较重码的方式是错误的,应该仅仅比较3755个一级汉字,才是比较正确的结论。这是一个悟性问题。因为二级汉字仅仅只有能简单找到的要求。可能牛人们喜欢常打二级汉字的单字,而本人是老百姓几乎从来没有用单字打过,顶多词组中有。
2015年05月16日 05点05分
level 11
散步de鹤 楼主
先说说两个单字码表的差别:
1、自然码单字码表,重码最高为7重码,大量单字有23重码,小鹤单字码表有少量2重码,基本无重,这是上面数据中小鹤选字数74,而自然码选字数1135产生的原因,我们知道重码增加记忆难度和击键难度而赛码只体现出击键减少;
2、小鹤因为码表设计的原因,有20多个2简空间让给了词,因此对于单字码表来说就空了这些2码字,这也是赛码结果中小鹤的二码字是6397,而自然码的二码字是7083的原因。于是我们还原只为了单字而赛码的真实,假定小鹤的2码字和自然码设计完全相同,小鹤的测试结果应减少击键7083-6394=689个,总按键67270-689=66581,平均每字按键=总按键66581/总字数20947=3.18,字均用键是低于自然码的3.19的。
于是我们可以看到,自然码通过大量选重而降低字均用键的情况下,依然在字均用键上高于小鹤,击键时间平均当量高于小鹤(此平均值越低体现同一时间击键越多,说明击键的容易程度),异手连击字数低于小鹤。以上三点说明同样的文字内容情况下,小鹤的单字编码用键少于自然码且更易按和左右配合字数更多。
三、分析一下自然码重码产生的原因
为什么自然码单字重码如此之高呢?这也是因为其取大字根所造成,大字根更容易形成重码;另一个造成自然码重码众多的原因是其部首优先的规则造成,很多字在部首不容易判断时采用了容错兼容码。也正是因为重码众多,使得自然码的音形码方案不得不蜗居于拼音输入法内充当辅助的角色,而失去其本来独立的地位。
以上数据看出,小鹤无论从双拼设计和双形设计上都是优于自然码的,双拼的左右配合更多,双形的重码更低,双剑合璧,舍我其谁,哈哈……
2014年08月29日 12点08分 16
关于2简字设计还有个重要的原因,小鹤的二简字安排除了常规的字频原因外还考虑了单独出现的机会,比如自然码的“农”字是二简,小鹤的“弄”字是二简,“农”字更多的是会以“农村、农民、农业”等词组的形式出现,而“弄”则比“农”有更多单独出现的机会。”
2014年11月02日 04点11分
这篇文章如果不是只赛单字的缘故,基本就不会有二简字“农”什么事,而这篇文章中“农”字出现130余次,“弄”只出现两次,这也是自然码二简字出现更多的一个重要原因,这样的二简字还有,自然码的 “国作构力促性机”,小鹤的“过做够里粗行几”。可以看看谁的二简安排更合理。
2014年11月02日 05点11分
1