[转][翻译]语法不仅是语言之法
人工智能吧
全部回复
仅看楼主
level 13
Bz_______ 楼主
2018年06月24日 12点06分 1
level 13
Bz_______ 楼主
2018年06月24日 12点06分 2
level 13
Bz_______ 楼主
这篇博客的灵感来自Tom Wolfe的讽刺书《语言的王国》(The Kingdom of Speech)。尽管这本书从讲早期人类的语言起源和演化开始,它的大部分内容是关于乔姆斯基和丹尼尔·埃弗雷特的一场争论,争论的内容是递归和其他语法结构是否存在于所有语言中。
乔姆斯基相信某种基因变异赋予了早期人类一种“语言器官”,所有的语言都必须遵守“语言器官”的“通用语法”。但埃弗雷特发现亚马逊Piraha说的一种极度简单的语言只含有极少的乔式语法,特别地,它根本没有递归性(即从句)。
我认为:两个人都是错的。语言中的语法只不过是所有智能动物“早期语法”的近代延伸,“早期语法”用于分析感觉、安排行动、规划想法。所有这些语法能力,除了最底层的,都由满足某种约束的可交换单元构成的层级结构组织,正如我们的语言。
2018年06月24日 12点06分 3
level 13
Bz_______ 楼主
我对句法的本质的研究来源于视觉,特别是计算机和动物中的视觉对象识别。我持的立场比较有争议。具体地说,我认为把图像解析成可见基元的组成需要语法,并且,正如脸由眼睛,鼻子和嘴组成,几乎所有的对象都是由低级生成元组成的结构。由此,图像中可见的所有对象的集合形成类似于语法的解析树。同样,几乎所有完备的动作都由次序相容的小动作组成,这些动作组成子动作。要点在于,完备的话语/图像/动作包含很多部分,其中一些是另一些的部分。把“包含关系”作为基本关系,我们可以画出一棵树:树的根是完备的整体,树的叶子是这一体系的基元。
但同时,每个部分可能是另外整体的另外一棵树的一部分,任一部分可以用其他东西替代,生成一棵新的树。就是说,部分可以交换,交换的约束适用于所有同种组成的树。
所有可能的生成元组成的集合是非常大的。每一组完备的话语/图像/动作包含很多部分,就像乐高积木,按照一定约束组合,直到整体。总之,所有这些数据结构是分层的,由可互换的部分组成,并受到不同复杂度的约束。我相信任何类型的结构都应该被称为语法。总之,所有这些数据结构都有层级结构,由可交换的部分组成,并受到不同复杂度的约束。我相信任何此种类型的结构都应该被称为语法。
2018年06月24日 14点06分 5
只要这种语法系统是完备的
2018年07月06日 15点07分
空间结构造成这一切语法,空间组合特性能包含一切物的变化了,都想象成空间上的关系,物的关系也最先来自空间关系,词语关系很多都在反映空间关系。生成关系则是独立的,其他结构关系不可理解,也不必理解那么多,也最多能理解了生成关系,而怎样生成的没必要知道了
2018年08月19日 13点08分
level 13
Bz_______ 楼主
以下是2009我在迈阿密的一个视觉研讨会上的一些例子。从语言的例子开始。记得学校教过你,英语句子由一个主语、动词和宾语组成,还有定语、副词、从句等等。
下面是一个非常爱说话的学步儿童的话语的解析(Laura C. G. Haggerty. What a Two-and-One-Half-Year-Old Child Said in One Day[J]. Journal of Genetic Psychology, 1930, 37(1):75-101.):
2018年06月24日 14点06分 6
level 13
Bz_______ 楼主
在这里,我们有两个经典的解析树,有第二句里表示隐含主语的问号,还有两个句法有联系的不相邻单词之间的连接(粗,细虚线)。
可换性的概念是用“for Margaret”这个词组来阐释的,这个词组可以放在无限多的其他句子中,是一个“介词短语”。
顶部的虚线存在,因为“cake”这个词必须与后一句话的“it”这个词单复数一致。例如,如果Margaret说她想做一些饼干,她需要在第二句话中用“them”(尽管这样的语法精确度对那个年龄段的玛格丽特来说是做不到的)。
一个远距离一致性的经典例子,用包含三个从句的一句话举例:
"Which
problem/problems did you say your professor said she thought
was/were unsolvable?"
这已经被用来论证乔姆斯基的转换语法。这很合理,但我们认为,这一切也发生在视觉上。因此,用来服从这些约束的神经机制必须更原始,在皮质上更广。
2018年06月24日 14点06分 8
level 13
Bz_______ 楼主
在其他语言中,一组中的部分甚至不需要相邻,并且一致性通常是远距离的。
例如在维吉尔的著作中,我们有这个拉丁语句子:
Ultima Cumaei venit iam carminis aetas
每个词的意思是"最后 Cumaea的 已经到达 现在 歌曲的 时代"
即“Cumaea歌曲的最后一个时代已经到来”。名词短语“最后一个时代”是由第一个和最后一个词组成的,“Cumaea歌曲”的所有格子句由第二个和第五个词组成,而动词短语“现在已经到达”在中间。
语序是一个表层的现象,但它背后也有部分, 由格和性别区分,可以和其他部分交换。这些部分共同形成一个树(深层结构)。
2018年06月24日 15点06分 9
level 13
Bz_______ 楼主
图像也能像句子一样自然地被解析树描述,令我大开眼界。关于这个理论的完整阐释,参考(Zhu S C, Mumford D. A stochastic grammar of images[M]. Now Publishers Inc. 2006.)
图像语法与语言语法最大的区别是,在图像中,部分之间没有线性顺序。甚至当一个对象遮挡另一个对象的一部分时,后者的两个非相邻图块其实是一个对象的一部分,由此可以推断出被挡住的部分。
下面是朱松纯的例子,是一个简单图像的解析树:
2018年06月24日 15点06分 10
显示世界中的景象,和语言一样具有嵌套关系:一个物体A由a、b、c组成,而a又由a1、a2、a3组成,所以用类似于语法树的方法解析图像也是可以的
2018年06月27日 07点06分
@- “就像语言,你抓了一部分,剩下的一部分成分的可选项就变少了”——任何一个状态命题,被最大程度地细分之后得到由零元谓词(这些零元谓词自身能够构成命题)组成的命题:p1&&p2&&p3......pn,如果一个谓词被确认了,那么可能的组合就减少了一半。
2018年07月01日 15点07分
@- (接上)设已经确认的谓词个数为k,那么可选情况(可能出现的状态)的个数就是2^(n-k)
2018年07月01日 15点07分
@- (接上)我这个观点好像来自于信息论,可能表述方式跟他有点不同
2018年07月01日 15点07分
level 13
Bz_______ 楼主
回到行动和计划的形成,显然行动和计划是分层的。只要考虑小学问题——写下制作花生酱三明治所需的步骤就行了。
不管怎么写,你都可以进一步细分动作,例如“步行到冰箱”可以被细分为“首先找到它,然后估计它的距离,然后采取一系列步骤检查障碍,然后到达冰箱手柄”,等等。学生不能赢,因为有这么多细节。你永远也写不完,因为其中隐藏了太多我们认为理所当然的细节!
显然,动作是由可交换部分组成的,显然它们组成的方式必须满足一定的约束。有的约束很简单,像“之前的动作做完了做下一个动作”,有的约束就比较复杂。
2018年06月24日 15点06分 12
“不管怎么写,你都可以进一步细分动作”——这就好比对人类的思维过程进行细分,要细分好多级才会得到最原始的思维元操作
2018年06月30日 14点06分
level 13
Bz_______ 楼主
总而言之,我相信任何能使用眼睛构建世界的心理表征的动物,或是能做出多步骤行动的动物,必然会开发用于使用语法的皮层机制。这包括所有哺乳动物和某些其他物种,例如章鱼和许多鸟类。这些语法涉及可交换部分构建的树的心理表示,这些树满足大量约束。
语言和复杂规划对人类来说可能是独一无二的,但是语法技能更普遍地存在。这是如何在哺乳动物大脑皮层中实现的,是一个主要的问题。在关于我们大脑如何工作的早期探索中,这是最基础的问题之一。
2018年06月24日 16点06分 14
level 13
Bz_______ 楼主
最后一段貌似会抽?
Language and sophisticated planning may well be unique to humans but grammar is a much more widely shared skill. How this is realized e.g. in mammalian cortex, is a major question, one of the most fundamental in the still early unraveling of how our brains work.
2018年06月24日 16点06分 23
1