【科学分析】汉语是世界上最先进的语言(转载)
太阳照万物吧
全部回复
仅看楼主
level 13
原作者叫【冷酷的哲学】
^_^ 原作者欢迎大家转载,让更多人看到此文
2013年08月21日 00点08分 1
level 13
一、语言水平高低的评判准则
  口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于传输的信号的规则
  计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
  传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
  抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
  【传输效率】又分两个方面,编码效率和传输速度
  编码效率:这个通讯协议能够把一个信息用多短的一串信号来表达
  传输速度:一段信号,能够以多快的速度传输
  评价一种语言的口语是否先进,就要分析上面这几个问题。
2013年08月21日 00点08分 2
level 13
二、语言的分类
  世界上的语言大致分为两种,【孤立语】和【综合语】
  (综合语 其下又划分为黏着语、屈折语等子类型)
  【孤立语】 单纯通过词与词之间的关系来表达不同的意思
  【综合语】 可以通过改变词的形态来表达不同的意思
2013年08月21日 00点08分 4
level 13
我们举个简单的例子:
  中文(孤立语):我昨天告诉他了。
  英文(综合语):I told him yesterday.
  英文你首先可以看到told和him两个变形,其中把tell变成told表示过去发生的动作。把he变成him表示客体
  而中文用昨天来直接指明时间,如果不指明时间则需要用“已经”、“过”之类来表示过去,而并不改变词的形态,中文还通过各自的位置来体现谁是主体谁是客体
  实际上,英语已经是综合语中非常接近【孤立语】的了。英语的未来时态用的词形和一般时态没有区别,而很多其他语言中不同的时态都是用不同的词形来表达的。英文对于各个词的位置有明确的规定,而很多其他综合语,诸如拉丁语中,词的位置可以不固定。换句话说就是可以说出这样的句子:Him yesterday told I 然后通过词形里的主格词形和宾格词形来判断究竟是谁告诉了谁
2013年08月21日 00点08分 5
level 13
三、数据压缩:【孤立语】的高超之处
  当计算机发展到了新的时代,人们开始研究如何在计算机上存储视频文件,一开始的方案极其简单,就是把一帧一帧图像全部都存储下来,但是这无疑是低效的,因为这里面的冗余信息太多
  举个简单的例子,一个夜晚的场景,画面上很多地方都是黑的,何必把每一个点的色彩反复记录呢?所以接下来的一个思路就是,不再存储每一帧图像的完整信息,而存储下一帧图像与上一帧图像之间的差异之处,两幅图像中颜色一样的部分全部跳过
  【孤立语】恰恰就具有这样的效果
2013年08月21日 00点08分 7
level 13
时间变形,可以依靠在第一句中加入时间状语完成描述,其后描述相同时间段的句子就再也不用考虑描述时间了,这就是【孤立语】的数据压缩能力。
  随着人类社会交流量的上升,一次交流的上下文就变得丰富起来,很多在单词、单句的条件下很有效率的信息交流方式,也就显得越来越冗余了,因此世界上的各个主要语言纷纷向【孤立语】靠拢。
2013年09月30日 11点09分 11
level 13
关于各个语言的表意效率,也就是信息密度,2011年法国里昂大学做了一个实验
  这个实验里,研究者找了59位不同语言使用者,其中包括英语、法语、德语、日语、汉语、意大利语和西班牙语。为他们提供了20段文字,这些文字都翻译成各自的语言,然后请这些人分别用正常语速朗读,研究者全程录音,然后研究者计算所有音节数量,计算朗读中表现的义项(表意的基本单位)的数量,最后得出结论
  研究的结果是
  【汉语】信息密度为0.94,位居 第一
  【英语】信息密度为0.91,位居第二
  德语(0.79)
  法语(0.74)
  意大利语(0.72)
  西班牙语(0.63)
  日语(0.49)
2013年09月30日 11点09分 12
实验资料ohll.ish-lyon.cnrs.fr/fulltext/pellegrino/Pellegrino_2011_Language.pdf
2013年09月30日 11点09分
level 13
此处信息密度是通过计算每个音节所包含的义项数量来获得的,由于义项的数量是从原始文本——英文版里统计的,翻译之后有可能会增加或减少义项,为防止翻译过程中的扭曲造成数据标准不统一,各个语言的文本都被单独翻译为越南语,然后与各自越南语文本中每个音节所包含的义项数量相除,最终得到比较公平的数据
  这让我不由地想到,经过大规模注水的现代汉语信息密度还是这么高,那么文言文究竟已经高到了何种地步?很遗憾没有这方面的研究
  不过,根据使用频率进行加权平均,现代汉语平均每个词中的字数差不多是1.5左右,在文言文中,其中很多都是用单音节词表达的,折中一下,我猜想文言文的信息密度达到现代汉语的1.25倍应该是不成问题的,这在古代更是个恐怖的数字
  因为拉丁语可不是比现代欧洲各主要语言简单,受到古代文字记录空间的限制,汉语的显然在文字记录方面更加占优,这也许就是我国古代文字记录非常丰富的原因所在
  有人说,音节不能作为衡量信息密度的单位,因为不同的音节,发音长度很不一样。这个问题提的非常好,事实上,我下一节就要讲到【英语】与【汉语】发音长度的问题,英语单音节平均发音长度比汉语长,因此在口语的信息密度方面,【汉语】的优势更大。
2013年09月30日 11点09分 14
的确,文言文很少的一句话,我们要拿很长一句才能翻译过来
2016年09月02日 05点09分
level 2
当人们知道英国和美国的真相,中国的文化受到追捧。
2016年11月25日 03点11分 15
1