sbxldsl sbxldsl
关注数: 5 粉丝数: 4 发帖数: 140 关注贴吧数: 9
编码中频率的作用 现有六个汉字「甲乙丙丁戊己」,假设它们之间是独立的,且出现频率(概率)如下表第一行所示:首先,根据信息论,我们可以得到该离散信源的熵约为1.435比特,也就是它的二进制理论平均码长约为1.435,保留三位小数,其计算式为:0.6*LOG(1/0.6,2)+0.3*LOG(1/0.3,2)+0.06*LOG(1/0.06,2)+0.03*LOG(1/0.03,2)+0.006*LOG(1/0.006,2)+0.004*LOG(1/0.004,2)=1.434717535,以熵作为比较编码效率的基础,那么它就是100%。 接下来,我们用ab两个字母采用三种不同的方法对它们进行唯一可译编码,算出平均码长后进行对比,以便弄清频率和编码方式对编码效率的影响。 第一种方式为等长编码。因为有6个待编码的元素,所以每个元素至少需要3个字母来编码,平均码长为3,编码效率为:1.435/3*100=47.83%,不到理论值的一半。 第二种方式为降序变长编码,即将待编码的元素按其频率降序排列,然后再按从越常见越码短的原则进行编码,其平均码长的计算式为:0.6*1+0.3*2+0.06*3+0.03*4+0.006*5+0.004*6=1.554,编码效率为:1.435/1.554=92.34% ,已经接近理论值。 第三种方式为升序变长编码,即将待编码的元素按其频率升序排列,上表中以反向来体现,然后再按从越不常见越码短的原则进行编码,其平均码长的计算式为:0.6*6+0.3*5+0.06*4+0.03*3+0.006*2+0.004*1=5.446,编码效率为:1.435/5.446=26.35% ,只有理论值的约四分之一。
声笔飞系的定制词典 飞系中有个可以定制的词典fmzdy.dict,它是飞单、飞码和飞讯共用的。 1 数选增加 如果要增加数选字词,可以利用的码位主要有sn、ssn、sbn和snb几种格式,其中s表示声母,n表示数字,b表示笔画。对于sn和ssn,因为23789已经被系统词典使用,这里的n就只能使用14560了。不过,在sbn和snb中,所有的10个数字都是可以使用的。 如何具体使用这些格式,用户可以发挥自己的想象力。在fmzdy.dict词典中,提供了一些示例,如:鸭y1 它们tm4 早zi2 争zu2 致z7e 暂z8a。 2 数选复用 如果对系统提供的默认数选字词不满意,可以对它们进行复用。比如,你想使用zd8来安排「争」字,那么系统自带的「重点」就会被挤到提示行的后面去。若不想移动光标来输入「重点」,可以加一个自定义的zd8a来输入它,表明它是第一个重码项。需要注意的是,除非绝对必要,一般是不推荐复用的,因为它会使系统自带的字词输入变得困难。 3 其它定制 以上讲的都是编码中带数字时的定制方法,数选字词只能在增强模式下使用。如果想在常规模式下使用自定义的字词,就不能在编码中使用数字。 这时,可以利用常规编码中的空闲码位。例如,「聆」字在用正码lvuo输入时,需要用u选择重码,而lvuu码位是空着的,于是可以在上面安排「聆」,以便缩短码长。 另外,对系统默认的sbb编码进行复用也是可能的。例如,比如,你想使用zua来安排「争」字,那么系统自带的「脏」就会被挤到提示行的后面去。但是,请自定义码不要与常规编码的字词如「瞒mmei」相冲突,因为这样很可能造成不可预知的问题。
声笔码引起的反响摘录 这篇小文是为了保存声笔系列码的第一个输入方案 —— 声笔码在用户中引起的反响。现在是 2023 年 11 月 8 日,声笔走过了近 20 年的发展历程,声笔码也发展成了更加优秀和成熟的声笔简码。但是,回想顶功的破壳诞生,心情复杂,声笔码对传统输入法的突破,仍然是值得纪念的。 (1) 声笔码用户何曜棠先生的来信: 简谈点对声笔码的感受,我对输入法了解不多,但十年余也试用过二三十种,付费的也近十种,都未如意,最终只得用双拚。几日前偶得声笔码,至今使用尚未及一周,就有一种微妙的感受,就是不管输入多久,思想和精神都没有丝毫 “负担”。过去每输入一个字,心似乎都要 “动” 一下,输入一两小时后,就想 “休息” 了。而现在这些 “感觉” 都没有了。这种感受不是我 “找来” 的,是 “自发” 存在的,并 “ 微妙” 感受到的。仔细一想,原因就在声笔码太简易了,什么字根、部件、拆分等等规律都没有。输入时可以说,几乎不用 “动脑筋”。学习使用未及一周,在输入速度上已感觉不下于使用多年的双拚了。想来不会再有更好的输入法了。先生开发出此码,真 “了不起”,造福脑民 “大矣哉”!老朽将 “八十古来稀 ” 矣,以上不敢 “妄言” 也。 幸运用户 何曜棠,hyt1928@163 2006-4-10 (2) 研究输入法研究者唐捺之先生在论坛的发言: 想写篇声笔码的文字已经好几天了。 在输入法相关论坛网站逛了大半年,接触了不少我从前没见过的输入法。个人认为,声笔码比其他几种都更有创意(当然文码的创意也是很明显的,但创意的实用性不如声笔码)。 声笔码有意识的将 26 键分为两类,声和笔,使得任何一窜编码都有可唯一识别性。虽然编码的空间相对较少,但是越常用的字词,在这里越能显示它的优势。而我们实际使用中,也正是绝大部分使用常用字词。 虽然声笔码的顶屏看上去是技术上的,但正是声笔这种二分法才使得它可以利用这种技术,所以所谓技术取胜的说法并不能道出它的本质。 声笔码的另一特征是它太简易了,简易得让人对它效率的真实性产生怀疑,当然只能怀疑。它的简易,使得它几乎可以拿来就用,这对它的发展前途有很大的正面作用。 (3) 输入法爱好者 556 先生在论坛的发言: 没唐捺之先生那么能写。不过对声笔码的喜爱是一样的。 (4) 输入法爱好者 Ssyfzy 先生在论坛的发言: 声笔系列是不是好马不好说,不过顶屏技术确是太高了,是输入法的一次革命,感谢戴先生为输入法所做的贡献! #输入法##顶功##声笔#
1 下一页