强人工智能的语言处理
强人工智能吧
全部回复
仅看楼主
level 10
ruiaijun 楼主
  本主题是有关计算机语言处理系列文章的第二篇。
2016年04月20日 08点04分 1
level 10
ruiaijun 楼主
    相关主题
  用语言做智能系统的信息基础https://tieba.baidu.com/p/4483970225
2016年04月20日 08点04分 2
level 10
ruiaijun 楼主
                 强人工智能的语言处理
                   目    录
  1、强人工智能和语言处理。
  2、语言处理要解决系统对语言理解的问题。
  3、语言处理要解决对人类语言资料的阅读和吸收问题。
  4、语言处理要解决与人类的语言交流问题。
  5、语言处理要解决叙述故事、过程的问题。
  6、语言处理要解决表达自己思想的问题。
  7、语言处理要解决论证理论的问题。
  8、语言处理要解决系统拿出自己的发明创造的问题。
  9、总结。
2016年04月20日 08点04分 3
level 10
ruiaijun 楼主
  无论是用计算机来做人类的办公室助手,还是用计算机来做强人工智能,语言处理都是计算机不能缺失的一项工作。我们在此处着重讨论,语言处理在强人工智能方面的目的和任务。
  1、强人工智能和语言处理。
  我在《用语言做智能系统的信息基础》一文中已经讨论得出结论,使用普通家庭电脑实现强人工智能,语言会是计算机唯一的信息。因此,语言处理处于至关重要的地位。
  即便是采用全信息模拟,也就是用具有接受各种信息能力的计算机系统(它的结构要比应用机器人还要复杂),也需要有语言处理技术的参与。
  因此,语言处理问题一直将是人工智能的重要课题。
2016年04月20日 08点04分 4
level 10
ruiaijun 楼主
  2、语言处理要解决系统对语言理解的问题。
  强人工智能具有类似于人类的智能,因此它对外界输入的、内部储存的自然语言都是理解的,而不是仅仅按照程序的机械安排,死板地进行处理。
  什么是理解?
  理解是在系统内部建立两份(或多份)信息间的联系。其中一些信息可以解释另一些信息。对于可以得到多种信息的系统来说,用来解释的信息可以是各种感觉信息。对于只能用语言作为唯一信息的计算机系统来说,被解释的与用来解释的信息就都是语言。
  如何处理用语言解释语言的问题,是语言理解的关键技术难题。更是一个关键的认识难题。
  认识上困难在于:人们常常把逻辑与语言混为一谈,逻辑不允许词语的相互解释,很多人也就认为语言不能相互解释。其实语言不过是一种人类用来交流,用来描述事物的工具,它本身与逻辑无关。如果语言一定要遵循逻辑规则,世界上的词典就几乎全部非法了。
  逻辑是思维过程中的一种规律,它可以是思维过程更加条理,表述更加清晰。逻辑会经常附着于语言上,用语言表述出来。但是逻辑并不能规定语言的表述规律。
  破除了对语言必须逻辑化的错误认识,才能摆脱语言理解的认识难题。
  语言理解的技术难题解决起来很难很难,我们以后会慢慢讨论。
2016年04月20日 08点04分 5
而我就在用逻辑的方法尝试在计算机上实现语言理解与处理。实际上我倒是觉得逻辑方法具有刻板性,不太适合处理模糊的语义,容错性较差。
2016年05月20日 05点05分
现在谷歌、百度等大公司都在用大量语料数据训练神经网络的方法,让计算机“无中生有”地产生语言处理能力。
2016年05月20日 05点05分
@建设西路东口 “让计算机“无中生有”地产生语言处理能力。”……其基本思路无非是把处理工作交给统计数学和模糊数学去做,这种处理与人类的目的明确、有的放矢的语言处理不是一个水平。只有摆脱统计数学和模糊数学的羁绊,语言处理才能够有生命力。
2016年05月20日 08点05分
level 10
ruiaijun 楼主
  3、语言处理要解决对人类语言资料的阅读和吸收问题。
  有了对语言理解的问题的解决方案以后,才能谈得到“对人类语言资料的阅读和吸收”。
  目前很多人都很关心“图灵检测”问题,想让计算机与人正常交流,而不被观察者发觉交流对手是计算机。要做到这一点,计算机必须具有足够的知识,才能不被发觉交谈对手是计算机。甚至,计算机应该掌握一些“欺骗”技巧,以便躲过观察者设计的分辨诡计。
  然而,计算机要做到这些,必须以“对人类语言资料的阅读和吸收”为基础才行。而“对人类语言资料的阅读和吸收”又必须要以计算机能够理解自然语言才行。
  即便是在解决了“计算机理解自然语言问题”以后,解决“对人类语言资料的阅读和吸收”也还需要很多专门的技术,它们也是很难很难的技术。需要我们逐一解决它们。
2016年04月20日 08点04分 6
level 10
ruiaijun 楼主
  4、语言处理要解决与人类的语言交流问题。
  计算机要能够与人类进行语言交流,也需要在解决了“计算机理解自然语言问题”以后,才能够实现。
  计算机与人类进行语言交流,有两个水平。
  第一个是低水平交流。计算机只要做到有什么说什么,不必把自己伪装成人类。这类交流用处很大,一般可用在三个方面:第一方面是用做计算机学习语言。我主张计算机系统要用学习的方式构建语言数据库,交流就是这种学习的形式。第二方面是用作对人类进行心理辅导,以降低心理工作者的负担。第三个方面是对学生进行学习辅导,以减少教师面对面辅导的负担。
  第二个是高水平交流。也就是可以让语言处理系统以假乱真地通过“图灵检测”的交流。在这种交流中,计算机系统不仅要具有丰富的知识,还要熟悉人类语言交流的很多习惯,才能让观察者分不出真假。计算机既然要把自己伪装成人类,就好要能识破人类为识别出计算机设置的各种陷阱、诡计。这很像是一个计算机与人类在下棋,计算机要能够用尽心思识破观察者与对话人共同设置的识别迷局,其难度要远远高于计算机与人类下围棋。
2016年04月20日 08点04分 7
level 10
ruiaijun 楼主
  5、语言处理要解决叙述故事、过程的问题。
  计算机要能够向人类“叙述故事、讲述过程”,还需要在解决了“计算机理解自然语言问题”以后,才能够实现。
  计算机向人类“叙述故事、讲述过程”,也有两个水平。
  第一个是低水平叙述。比如它要把自己“听”(接受)的一个故事,用自己的语言讲述出来。再比如它要把自己“听”(接受)的几个故事,连接在一起用自己的语言讲述出来。或者把自己的操作经历、活动经历,按顺序讲述出来。
  尽管这还是一种低水平讲述,但是实现起来技术难度还是是挺大的。例如战胜围棋高手的那个设备,就不会自己把为什么下哪一步棋说出来。
  第二种是高水平叙述。那就是在收集到大量故事以后,把这些故事组织成小说。需要说明的是,计算机写小说并不是什么新鲜事,十几年前,就有一篇计算机写的小说闻名遐迩。不过我们不欣赏那种计算机写小说的技术。它是先由人编写好小说的逻辑关系式,然后由计算机按逻辑关系式表达出语言。实质上,小说的骨干还是由人写出来的。
  我们主张的计算机写小说,要由计算机自己列出小说提纲,收集相关素材,确定各种人物。并根据自己确定的方案,在没有任何人为控制下,写出小说。
2016年04月20日 08点04分 8
level 10
ruiaijun 楼主
  6、语言处理要解决表达自己思想的问题。
  有人把计算机产生自己的思想看得很神秘。其实思想并不是一个很神秘的东西。它是在一个系统具有意识(或模拟意识)后,从自己意识角度看到的不同于他人的那些东西的概括和总结。
  在对思想有了明确的认识后,使系统产生思想的问题,也就好解决了。我们在第二段讨论语言理解时,就指出语言理解可以把外部的语言资料,变成自己的资料。这里所谓的自己,就是指得是意识。也就是说,语言理解是把输入到系统的语言,由简单的存储状态转变为由意识掌控的状态。当系统的意识掌控的资料足够多的时候,意识机制就会在思维操作的支持下,对资料进行概括和总结。这种操作使得意识机制掌控的资料得到高度的浓缩。这些浓缩后的意识机制掌控的资料,就是该系统自己的思想。
  显然,系统自己的思想于外界输入的资料关系密切,获得不同外界资料的系统会有不同的思想。即便是获得相同外部资料的系统,也会由于获得资料顺序的不同,系统经历的不同,会有思想的差异。因此不同系统思想的差异性是绝对的,原因是十分明显的。
  了解了系统产生自己思想的过程,解决表达自己思想的问题也就不难解决了。它无非是把自己的思想,用第5段的方式叙述出来就是了。
2016年04月20日 08点04分 9
level 10
ruiaijun 楼主
  7、语言处理要解决论证理论的问题。
  系统有了自己的思想,就产生了提出自己的见解、理论的现象。而系统为了让外界(别人、其它智能系统)理解自己的见解、理论,就需要解决论证理论的问题。
  很多人错误地认为,要解决论证理论的问题就必须采用逻辑推理操作了。其实问题要远比这复杂得多,很多问题要是用思维操作中那些不是逻辑推理的操作来完成,才能彻底解决。思维操作的逻辑推理分支,仅仅是在最后的论证中起作用。
2016年04月20日 08点04分 10
level 10
ruiaijun 楼主
  这里有这么六点工作要解决:
  第一要解决观点的提出。这首先是要使系统能够进行一些观点的提出。又分别有三种情况:由大量整理资料中产生新的观点;由部分事实或部分思考中产生的新观点;由纯思考产生的新观点。三种情况中只有前一种依据较为可靠,后两种观点产生的一句都不十分可靠,它们属于猜想(或部分猜想)。
  第二要解决观点的外查询。系统内部提出的观点,有时是系统外部已经玩得不能再烂的观点。如果在这类观点上花功夫,显然没有什么意义。因此系统要把内部提出的观点,拿到外部去查询。看系统观点的有意义程度,如果此类观点较为新颖,才有进一步加工的价值。
  第三要解决理论的提出。系统把一系列自己提出的有意义的观点,用思维操作的综合操作、抽象造作、概括操作等加以总结提炼。按理论的形成规则表示出来。就完成了理论的提出。
2016年04月20日 08点04分 11
level 10
ruiaijun 楼主
  第四要解决论证资料的收集问题。由于系统是自己完成提出理论和论证理论工作的,不可能由别人帮助它收集论证资料,收集论证资料的工作必须由它自己完成。
  第五要解决论证方式的确定问题。由于系统是自己完成提出理论和论证理论工作的,不可能由别人帮助它写出推理的逻辑形式,因此如何进行推理要由系统在逻辑推理方式中自己选择并确定。可以看出,系统论证理论的问题,远比推理机推理论证复杂得多。推理机推理不需要自己选择推理方式。
  第六要解决最后论证工作。在前五项工作都准备好的情况下,就可以有条有理的用语言把理论论证表达出来。完成论证理论的工作。逻辑推理操作仅仅在此步骤中,才有用处。
2016年04月20日 09点04分 12
level 10
ruiaijun 楼主
  8、语言处理要解决系统拿出自己的发明创造的问题。
  系统自己拿出发明创造来,对于人工智能系统是一个很高水平的要求。但是实现起来也并非非常困难。因为我们只要抓住产生发明创造的关键操作,系统自己拿出发明创造来,就会随之实现。
  那么,什么是产生发明创造的关键操作呢?它就是想象操作。首先要注意的是,目前有很多人把想象与联想混为一谈,把联想错当成想象。
  联想是一种回忆操作,一个人(或一个系统)的联想再丰富,想到的也都是已经记忆下的东西。因此它是回忆操作的一个分支。
  而想象则不同,一个人(或一个系统)想象出的东西,即便再简单,也不是已经记忆下的东西。它是这个人(或这个系统)新构想出的东西,它必须是原有记忆中所没有的东西。
2016年04月20日 09点04分 13
level 10
ruiaijun 楼主
  想象有两种类型:一种是再造型想象。它以原有记忆资料为模板,把原有记忆资料重新装配,过拆分后重新装配,从而得到原有记忆中没有的东西。另一种是反向思维型想象。它也以原有记忆资料为模板,但是专门从模板没有过的组织形态去思考,拼装出记忆资料认为不可能的东西。
  一个人(或一个系统)的发明创造,就从上述两类想象出发。经历过提出想象、完善想象、从技术上实现想象、修改技术成果、获得发明创造,这样一些环节。最后完成发明创造。
  一个人(或一个系统)的发明创造的每一个环节,都离不开语言的协助。最后还要有语言把发明创造的全过程,总结和记录下来。甚至要通过语言参与的理论活动,把发明创造有技术上升为理论,并加以论证。
2016年04月20日 09点04分 14
level 10
ruiaijun 楼主
  9、总结。
  我们上面讨论的八项内容,对语言处理工作提出了相当高的要求。这八项内容的实现,就相当于一个与人类类似的智能系统已经构造完成。
             (本文于2016年4月16日完成)
2016年04月20日 09点04分 15
1 2 尾页