火星的日升日落
火星的日升日落
关注数: 113
粉丝数: 200
发帖数: 6,600
关注贴吧数: 118
天天都能发掘出新用法
天天都能发掘出新用法
天天都能发掘出新用法
天天都能发掘出新用法
吧主新官上任,不多发技术帖,反而删技术老帖是何用意 自设吧规,然后宣布我多年前的“我的自制机械手”一帖违反吧规,予以屏蔽。 如此可笑的理由,仿佛是用今天的法律审判古人一妻一妾犯重婚罪一样。
不断发掘出有用的功能。
千元台式机实现chatgpt功能
千元台式机实现chatgpt功能
Python程序转换成js程序或者C语言 这是使用超级宏定义功能,把Python程序转换成js程序的效果。 用Python语法写程序后,转换成js程序或者C语言程序,可以提高编程效率。 python编程效率要高一些。以后会Python的人越来越多,那么你做js或者C语言项目的时候,你可以用只会写Python的员工来完成工作。 很多单片机上无法运行Python语言,但是能运行C语言。采用现在这个方式,你也可以用Python语言为它编程,再转换成C语言小修小改后就能给它使用了。 你看我的超级宏定义里面,转换成功的语句都是“@: ”开头的,这就方便中间过程插入干预。 你都可以Python与C语言混写,比如说在上面的for循环里面用C语言操作外部io地址,这些语句就不会被转换。你检查中间生成的文件时候就能看出来,Python转换来的语句都是“@: ”开头的,可以重点检查它们。然后再运行一个exe,就可以把这些开头字符串去掉了。
独立智能体 以sson格式字符串与bamboo语言,构建一个随处可生存的智能体示例: “body(rect(100,200,64,16) color(255,0,0) text(0) onclick(R10=atol.dcl($$self1.text)+1;$$self1.text=todec.dcl(R10)) )” 这里的sson格式字符串这是一个随处可生存的智能体,它的数据变量与生存程序都保存在这个字符串里。把它传送给一个图形界面程序以后,就会显示出一个红色方块,上面显示数字“0”,点击一下红色方块以后,这个数字就会加一,图形界面上也就显示出数字“1”。 再把这个智能体字符串传送给互联网上的另一台计算机上的图形界面,它就会从数字“1”开始显示。所以它是在互联网上随处可生存的,生存于各种配置的计算机中,生存于各种操作系统中,生存于各种编程语言编写的软件中。 $$self会被赋值为“body.onclick”,后面如果跟了一个数字n,则表明要倒退n级。所以$$self1会被赋值为“body”,$$self1.text会被赋值为“body.text”。
互联网上随处可生存的智能体 以sson格式字符串与bamboo语言,构建一个随处可生存的智能体示例: “body(rect(100,200,64,16) color(255,0,0) text(0) onclick(R10=atol.dcl($$self1.text)+1;$$self1.text=todec.dcl(R10)) )” 这里的sson格式字符串这是一个随处可生存的智能体,它的数据变量与生存程序都保存在这个字符串里。把它传送给一个图形界面程序以后,就会显示出一个红色方块,上面显示数字“0”,点击一下红色方块以后,这个数字就会加一,图形界面上也就显示出数字“1”。 再把这个智能体字符串传送给互联网上的另一台计算机上的图形界面,它就会从数字“1”开始显示。所以它是在互联网上随处可生存的,生存于各种配置的计算机中,生存于各种操作系统中,生存于各种编程语言编写的软件中。 $$self会被赋值为“body.onclick”,后面如果跟了一个数字n,则表明要倒退n级。所以$$self1会被赋值为“body”,$$self1.text会被赋值为“body.text”。
互联网上随处可生存的智能体 以sson格式字符串与bamboo语言,构建一个随处可生存的智能体示例: “body(rect(100,200,64,16) color(255,0,0) text(0) onclick(R10=atol.dcl($$self1.text)+1;$$self1.text=todec.dcl(R10)) )” 这里的sson格式字符串这是一个随处可生存的智能体,它的数据变量与生存程序都保存在这个字符串里。把它传送给一个图形界面程序以后,就会显示出一个红色方块,上面显示数字“0”,点击一下红色方块以后,这个数字就会加一,图形界面上也就显示出数字“1”。 再把这个智能体字符串传送给互联网上的另一台计算机上的图形界面,它就会从数字“1”开始显示。所以它是在互联网上随处可生存的,生存于各种配置的计算机中,生存于各种操作系统中,生存于各种编程语言编写的软件中。 $$self会被赋值为“body.onclick”,后面如果跟了一个数字n,则表明要倒退n级。所以$$self1会被赋值为“body”,$$self1.text会被赋值为“body.text”。
为什么可以说“我爸爸”,“我妈妈”,却不能说“我狗”,而是要说“我的狗”? 为什么可以说“我爸爸”,“我妈妈”,却不能说“我狗”,而是要说“我的狗”? 这是一个语言学的老大难问题,以下是我刚刚作出的解释: 第一,带的与不带的会引起歧义的,必须带“的”。 第二,这说明大脑有对我字的关联词的类别进行统计,而不仅仅是对具体的词进行统计。统计出来排序在前面的类别,例如亲属、器官、家庭等等可以不带“的”。而“动物”类别在我字后面的次数除以总词频的排序靠后,所以需要加“的”。亲属类别排序靠前,类别里的每一个词都可以不需要加“的”。“大爷爷”虽然是“大+爷爷”,但是仍然属于亲属,所以可以有“我大爷爷”这种用法。“好爷爷”不属于亲属类别,而是亲属类别前面加了形容词,所以就不能有“我好爷爷”这种用法。
人工智能终于可以解读词典了 既方便人工编辑又方便电脑自动生成的词典格式来了。 哪个国家:=(哪里);+(是~人),+(来自~),-(~机构),-(~单位) +()是指正例,-()是指反例。 这种格式在兼顾了传统的词典编辑方式的同时,也便于人工智能临时解读词典。 这就是我的人工智能的智慧源泉,它就是这么朴实无华,摈弃神秘化,拒绝故弄玄虚,完全符合符号主义的“用自然语言解释自然语言”的原则。
可以从语义理解层面上解读字典的人工智能终于诞生了 昨晚忙到十二点,可以从语义理解层面上解读字典的人工智能终于诞生了。除了字典,像情感分析这种任务也可以像字典一样编辑,同一种分类可以对应很多条语句,而且后续还可以不断添加。字典编辑完毕后,把字典喂给机器人,机器人就能帮你完成你指定的任务了。 为此设计了一种全新的机器学习算法,这是一种理论完备的算法,可以随心所欲地改进。它打开了一道大门,以后人们就可以用编词典的方式来训练机器人了。只要能编词典,你就能训练出你自己的机器人。
系统论与还原论 今天在查询“语气副词”的时候发现语言学家的研究成果还是可以给后人乘凉的,说“开除一个语言学家,语音识别准确率上升三个点”者是何其愚蠢。http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fm.gaosan.com%2Fgaokao%2F237848.html&urlrefer=1c7895a576b2a79d65c15b7a604a6876 究其根源,就涉及到了系统论与还原论之争了。中医与西医的研究方法区别,就是典型的系统论与还原论的区别。在机器学习领域,鼓吹黑盒子、端到端一个公式拟合一切的就是系统论,像我这样提倡分解问题到百分之百可解释、公式与公式组合的就是还原论。 系统论不可避免地成为妄想一步登天做梦者狂欢的舞台,重灾区就是生命科学与深度学习。理工科一直都是还原论的天下,只有遵从还原论的研究方法,才能像蚂蚁啃骨头一样攻克一个个高不可攀的难关。我读书的时候,老师就告诉我们,中国人还是稍显浮躁了一点,像合金的各种成分配比对性能的影响的工作,都是西方与前苏联的科学家们一点一点做出来的。 一条是每个人都口吐莲花、天花乱坠的路,一条是默默攻坚克难的路,只要成功,你就是王者。孰去孰从,就看你自己的选择了。 谈人工智能15:分析还原的威力 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fblog.csdn.net%2FVucNdnrzk8iwX%2Farticle%2Fdetails%2F120944362&urlrefer=49aad1b378212323377bcada56260ed8
基本上在理论上“彻底”解决了图像识别问题。 很多文抄公天天看论文,以显摆洋文名词为荣、以跟在别人论文后面为荣,根本理解不了我基本上不用看别人论文是因为我基本上已经可以藐视一切论文、藐视一切大师。他们也不看看他们自己的技术原创率只有百分之十,居然可以非议技术原创率达90%的我为民科,纯粹是因为他们没有理性思维能力,以肤色取人,见到洋人就顶礼膜拜为大师,见到国人则踩为民科。 井底之蛙们不会跳出他们那口井,站到更高的角度看问题。撅着屁股在忽悠人的伪科学面前顶礼膜拜,再日夜研读个100年论文也就那点出息了。他们就像是在争先恐后爬树想到达月球,殊不知我一出手就以他们闻所未闻的方式造出火箭直达月球了。
看到群里有人用1TB内存做检索,突然想起我有点自我设限了。潜 看到群里有人用1TB内存做检索,突然想起我有点自我设限了。潜意识里就把统计数据大小局限于几百GB,其实只有我的技术才能快速检索几百TB的统计数据。拿硬盘当内存用,1TB内存的价格就足够我架设一个快速检索200TB统计数据的计算机集群了。 我虽然经常说千元台式机算力胜过单个人脑,比起别人对计算机算力有更深刻的认识,但是对它的算力我有时候依然还有思维桎梏,需要时时突破一下。计算机技术的精髓就是用好计算机的蛮力,能够“简单粗暴”地解决问题时决不做多余工作。
我的机器学习算法与深度学习相比最大短板就是不开源,为了弥补这个短板我先后承诺了免费使用、免费开发。对比之下深度学习每个月的服务器租金就是几万元计的,我是免费。至于开发费用更是大头,随便一个简单任务都比上面的租金大很多倍。不过现在的市道变了,多数人都是为了圈钱或者水论文,所以上述条件根本打动不了他们。只能想想其它大招了。技术世界本应该是“物竞天择、胜者为王”,我就像一个能够跑9秒的短跑运动员,年复一年地看着一个只能跑12秒的选手窃据冠军之位,还大谈他跑步技术的先进性。我绝对是要掀桌子、大闹天宫的。
我的高精度机械手,可以用于3d打印或者写字。
我发表了一篇图片贴,大伙来看看吧~
充分利用全人类的已编写程序。 我现在已经可以在一个软件里混合使用各种编程语言编程、汇集很多台机器协同工作。接下来就是怎么样充分利用各种语言函数库(类库)的问题。所以我设计了以下方法,可以使人快速找到自己想要的函数。 1.用中文给函数写一段说明,利用我的中文语义检索功能找到所需要的函数。 2.使用标准格式写函数接口,IN(STR,DWORD)OUT(STR),IN2(I,I,IO)。IN()里面是输入参数的VOID,BOOL,CHAR,BYTE,WORD,DWORD,int,long,FLOAT,DOUBLE,STR,StrFile,CString等数据类型,如果是指针加上'*'。(如果侧重于字符串处理也可以只有STR,int两种类型,有文件加一个strFile)。IN2()里面是输入参数的in,out,inout三种属性。 3.写几个标准示例,字符串用“123”,“ABCDEFG”,“1+1”,“例A 例B 例C”,“123\n”,“123\nABCDEFG\n”,数值用1,2,3。例如atoi()就写成“IN("123")OUT(123)”,去除汉字的函数就写成“IN("例A 例B 例C")OUT("A B C")”。如果有需要还可以加上IN2()格式。 一个函数如果写了这三种说明,找函数时就只要写上述的一种或者两种说明就能找到了。 带有文件操作的函数或者命令行也可以这样写第三种说明: 3.文件参数的标准写法,用FileA,FileB,FileC,FileD代表四个文件“123\n”,“123\nABCDEFG\n”,“123\nABCDEFG\n1+1\n”,“ABCDEFG\n””。例如读取文件的第n行的函数就可以写成IN("FileB",1)OUT("ABCDEFG")。两个文件合并的函数就是IN("FileA","FileD","FileB")OUT()IN2(I,I,O)。 第二第三种格式是一种全新的方法,它让人通过举例子就能找到所需要的函数或者软件。
充分利用全人类的已编写程序。 我现在已经可以在一个软件里混合使用各种编程语言编程、汇集很多台机器协同工作。接下来就是怎么样充分利用各种语言函数库(类库)的问题。所以我设计了以下方法,可以使人快速找到自己想要的函数。 1.用中文给函数写一段说明,利用我的中文语义检索功能找到所需要的函数。 2.使用标准格式写函数接口,IN(STR,DWORD)OUT(STR),IN2(I,I,IO)。IN()里面是输入参数的VOID,BOOL,CHAR,BYTE,WORD,DWORD,int,long,FLOAT,DOUBLE,STR,StrFile,CString等数据类型,如果是指针加上'*'。(如果侧重于字符串处理也可以只有STR,int两种类型,有文件加一个strFile)。IN2()里面是输入参数的in,out,inout三种属性。 3.写几个标准示例,字符串用“123”,“ABCDEFG”,“1+1”,“例A 例B 例C”,“123\n”,“123\nABCDEFG\n”,数值用1,2,3。例如atoi()就写成“IN("123")OUT(123)”,去除汉字的函数就写成“IN("例A 例B 例C")OUT("A B C")”。如果有需要还可以加上IN2()格式。 一个函数如果写了这三种说明,找函数时就只要写上述的一种或者两种说明就能找到了。 带有文件操作的函数或者命令行也可以这样写第三种说明: 3.文件参数的标准写法,用FileA,FileB,FileC,FileD代表四个文件“123\n”,“123\nABCDEFG\n”,“123\nABCDEFG\n1+1\n”,“ABCDEFG\n””。例如读取文件的第n行的函数就可以写成IN("FileB",1)OUT("ABCDEFG")。两个文件合并的函数就是IN("FileA","FileD","FileB")OUT()IN2(I,I,O)。 第二第三种格式是一种全新的方法,它让人通过举例子就能找到所需要的函数或者软件。
充分利用全人类的已编写程序。 我现在已经可以在一个软件里混合使用各种编程语言编程、汇集很多台机器协同工作。接下来就是怎么样充分利用各种语言函数库(类库)的问题。所以我设计了以下方法,可以使人快速找到自己想要的函数。 1.用中文给函数写一段说明,利用我的中文语义检索功能找到所需要的函数。 2.使用标准格式写函数接口,IN(STR,DWORD)OUT(STR),IN2(I,I,IO)。IN()里面是输入参数的VOID,BOOL,CHAR,BYTE,WORD,DWORD,int,long,FLOAT,DOUBLE,STR,StrFile,CString等数据类型,如果是指针加上'*'。(如果侧重于字符串处理也可以只有STR,int两种类型,有文件加一个strFile)。IN2()里面是输入参数的in,out,inout三种属性。 3.写几个标准示例,字符串用“123”,“ABCDEFG”,“1+1”,“例A 例B 例C”,“123\n”,“123\nABCDEFG\n”,数值用1,2,3。例如atoi()就写成“IN("123")OUT(123)”,去除汉字的函数就写成“IN("例A 例B 例C")OUT("A B C")”。如果有需要还可以加上IN2()格式。 一个函数如果写了这三种说明,找函数时就只要写上述的一种或者两种说明就能找到了。 带有文件操作的函数或者命令行也可以这样写第三种说明: 3.文件参数的标准写法,用FileA,FileB,FileC,FileD代表四个文件“123\n”,“123\nABCDEFG\n”,“123\nABCDEFG\n1+1\n”,“ABCDEFG\n””。例如读取文件的第n行的函数就可以写成IN("FileB",1)OUT("ABCDEFG")。两个文件合并的函数就是IN("FileA","FileD","FileB")OUT()IN2(I,I,O)。 第二第三种格式是一种全新的方法,它让人通过举例子就能找到所需要的函数或者软件。
刚刚设计了一个极简脚本
Micro QQ 功能上线了✌️ Micro QQ 功能上线了
华为与谷歌的操作系统之争其实是底层之争。现在小博的编程方式处 华为与谷歌的操作系统之争其实是底层之争。 现在小博的编程方式处于更高层级。 不同人用不同语言写的程序以及各种现成的软件可以在不同操作系统、不同机器上协同运行,为同一个功能所用,还可以有人工参与。多机合作,人机合作,完成同一个任务。 能够在微信群里完成的任务,都可以用web api的方式完成。用户发出一个url就能把任务完成了,完全不用管这个任务有多少台机器,多少个人参与协同完成。所以不管多么复杂的功能,都可以被人用一行程序所调用。
微信机器人调用命令行程序 今天朋友叫我给小博增加一个拼凑价格(凑单)的功能,用准自然语言编程实现起来还有点费劲。为了赶时间,我就直接花了二十分钟用VC实现了。 然后再配上小博与命令行程序的接口,就给小博添加上这个功能了。 上面是添加功能示例,朋友们有什么应用程序需要跟小博连接,只要上传给我就可以。 朋友们想用python,javascript给小博写程序也可以,下星期就可以开通。
公开我的BSON数据格式。 公开我的BSON数据格式。 BSON(BambooScript Object Notation) 是一种轻量级的数据存储交换格式,最初用于我的bamboo动态语言。比起json,它使得人们更容易的进行阅读和编写。同时也方便了机器进行解析和生成。用于准自然语言编程时,它可以是集程序与数据(变量)于一体的内存体,也就是一个字符串就相当于诸葛亮这样一个智能体。你把这个字符串传送给刘备,就相当于把诸葛亮这个活人传送给他当军师了。 BSON里变量的数据都放在左右括号内,变量名称则放在左括号之前,可以多层嵌套。变量之间用空格或者逗号隔开。例如“a(b(1) c(uvw))”,就相当于有两个变量,a.b=="1",a.c=="uvw"。 BSON与准自然语言编程一样,不区分变量类型,唯一的变量类型就是字符串。程序可以用atol(),atof()这一类函数或者base64等编码把字符串转换为其他类型的数据。 BSON里变量支持数组格式,数组成员就是放在同一对括号内的各个变量,变量之间用空格或者逗号隔开。这些变量用数组形式访问的时候,以先后顺序作为下标。例如“a(b(1) c(uvw))”,也相当于有两个数组成员,a[0]=="1",a[1]=="uvw"。a.b,a.c形式依然有效。 BSON里的主程序放在最外面一级的main()内,例如"main(xxx),a(b(1) c(uvw)),obj2(a(b(1) c(uvw)))"里面就有一段程序“xxx”,四个全局变量a.b,a.c,obj2.a.b,obj2.a.c。
深度学习的可解释性 发现我回复的帖子都不能排到前面,再试一下。
李德毅院士:新一代人工智能如何从传统人工智能中脱颖而出 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F_awQB6MdihdoyjLLSY6DHQ&urlrefer=9b1b0172d73e7080645fd5716bafd64f 不要被标题误导了,我要做的是批判他的观点。 这世界上究竟有没有不确定的问题都要打个问号。我以前做扑克牌游戏的时候就发现电脑产生扑克牌时,CPU越慢越不够随机,真的有一台高速电脑模仿它的每一步的话,是能够把它产生什么牌都计算出来的。而且可以推论,如果没有外部的宇宙的影响的话,我们这个宇宙发生的一切事都是在大爆炸的瞬间就已注定。 在逻辑面前,一切都是确定无误的。明明都是确定的答案,自己解不出来,还美其名曰“不确定性人工智能”,这是我对神经网络派很鄙夷的地方,所以我一直称他们是跳大神的。自己能力所限做不到你就老实呆着,让能解决问题的人上,不肯老实做事还出来宣扬这种错误观点就是你的错了。
老是被人质疑,只好贴个图——我写的C++编译器是如此的独一无二,相信没有人会认为它与别的C++编译器有亲缘关系了吧。 我的C++编译器跟gcc没有半毛钱关系,从来没有借鉴过别的C++编译器源码,两个星期就写了一个32位虚拟机与所有代码可浮动随处可运行的C++编译器。借鉴别人源码只会拖慢我的速度。
自然语言编程示例。
自然语言编程示例
拯救AI独角兽:人工智能产业集体进了「ICU」? 拯救AI独角兽:人工智能产业集体进了「ICU」? http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Ft.cn%2FA6tuhgQ0&urlrefer=b62c5df21732ae49083c638930f3d6ee “一群骗子”,从深度学习在国内进行炒作开始,我就一直是站在他们的对立面的。因为我最知道他们几斤几两,我用千元台式机完成的工作,他们居然用三万六千个CPU来完成还说远远不够。抛开我的成果明明胜过他们却被他们的声浪淹没的恩怨不谈,我一直旗帜鲜明地攻击他们主要还是因为认为他们做的是伪科学炼丹术,从命名炒作开始的各种行事风格都是与我的自然科学世界观格格不入的。他们风光时我用这四个字称呼他们,现在他们牛皮吹破了我也没有必要改口,毕竟这是自始至终的态度,也不算落井下石。
恭喜学术界搞出了一个本民科去年公开的算法。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fa1PLH8wF229obQla43hMKA&urlrefer=ef78ddb56c2cbf73331bf07dc7cb76c0
百分之百正确率的机器学习体系做出来的伪原创
这几年的元旦的记忆模式基本上固化了,总是与“元旦 加班 天冷 骑车 戴手套”这几个关键词联系起来。而且路上总会想起1998年五一节一大早在石牌出租屋里面焊线路板做实验的一幕,那时候的冲劲与对未来的憧憬仿佛还在昨天。多年已过,我的工作模式与心态依然如旧, 走出半生,我依然还是那个少年! 附图是我今年在VC方面的工作统计。另一张图是昨天一口气写的8个工具软件,我的战斗力还是杠杠的。[耶]
#天天早上有灵感#,对现有的聚类算法很不满意,每次运行得到的 #天天早上有灵感#,对现有的聚类算法很不满意,每次运行得到的结果居然是不确定的,难怪现在很多机器学习得到的结果是不确定的。于是我自己动手,设计出了一个可能是最好的聚类算法。多维的可能不太好理解,所以就以二维为例, 先根据xy尺寸以及样本数量确定一个二维方块大小,作用就像LED显示屏里面的里面的一个显示方块(像素点),再统计所有方块里面的样本点个数,这个个数值就像是这个图像块的浓淡,划分一个阈值,删除有样本点的方块的数量的1/3,即删除最淡的一部分图像块,这样就完成了把整个二维图片“染色”的任务,分成了一个个图像块。然后再使用“腐蚀”功能,一层一层腐蚀,就能找到每个图像块的中心点,这个中心点总是最后被腐蚀掉的,这时候它的上下左右已经没有其他点。这个中心点就代表了这个聚类(图像块)的种类。前面被删除的图像块里的样本种类则由离它最近的图像块聚类种类决定。如此就得到了精确完美的结果。 由此联想到机器学习领域种种不好的风气。做不出精确结果不是你的错,但是如果因为你做不出精确结果,你就鼓吹不确定性那就大错特错了。就像用深度学习做聊天机器人,他们由于能力所限,连想象都不敢想象我可以用千元台式机实时检索10亿、百亿条规则、检索全人类知识,居然有脸造谣“检索是落后的”;做不到用准自然语言对机器人教学,居然造谣“设置问答是落后的”。至于那些人云亦云的粉丝们,只能说他们在世界观养成阶段没有受到科学精神的熏陶,根本不具备科学的世界观。只能拜托他们在免费为洋大爷们摇旗呐喊的时候别那么卖力,给国产民科们留一点发声空间。🙏
以几个例子戳穿深度学习的谎言。 与深度学习粉丝们商榷。 以几个例子戳穿深度学习的谎言。 与深度学习粉丝们商榷。 1.训练拟合一切。那就比试一下,请你训练一个能够报出中国十四亿人每个人姓名生日的模型吧。这个对程序员或者说对搞搜索引擎的程序员是很简单的事,有数据时,用千元台式机一个程序员一天可以搞定,看看深度学习能够花什么配置多少人力多久可以搞定?从中还可以戳穿GPT3的谎言,用45TB的数据训练,损失了多少信息,交给搜索引擎来做,那是保真每一个字节的。 2.端到端一个公式拟合一切。宣言这个是对所有科学家的侮辱。很多科学家穷其一生只是证明了一个定理公式,作用何在?就是因为宇宙里的组合是无穷无尽的,只有不断找出子规律(定理公式),用子规律与子规律组合才能有效减少组合数目。就像“小明在天河区棠下卫生院工作了三百天”、“小王在黄埔区89中学工作了一千天”这一类别的语句总结规律,以一百万的的词库为例,组合数目就达到了一百万的九次方,不划分子规律混成一锅粥来找规律是何其荒谬?用我的语义正则表达式(传统符号主义)来做就简单了,在前人总结出的词性、单位这些子规律的基础上进行组合,“人名 在 单位 工作 了 数量 天”一举搞定。 3.又有粉丝说“端到端一个公式”搞定,深度学习自动化程度多高啊。问题是这是个谎言啊,你也当真了?谎言都是听起来让人很爽,同时对应的就是“信的人很傻”,就像传销洗脑“一年赚一个亿”一样。深度学习的套路就是让粉丝们学很多高等数学的东西,一是弥补神经网络的缺陷,事实干活的还是符号主义的公式与编程。二是在效果不如意时粉丝们会自怨学艺不精,而不是怀疑深度学习有问题。其实人工智能技术应该是帮人干活的,而不是人帮它干活的。像我的机器学习算法就从来追求的是“初中生就能操作”,使用者只要归类好正例反例,就能坐享成果了。像问答机器人需要的是海量的知识(工作量),我一个光杆司令做的就可以吊打百度微软的重点生命线产品了,究竟谁更自动化?那些粉丝们居然有脸照吹不误。
分享我的跳跃式穷举与随机跳跃式穷举 级数多的穷举太费时间,所以又推出了跳跃式穷举,随机跳跃式穷举。跳跃式穷举可以使用一个辅助链“4_00000000”,开头数字表示每一次递增4(每一级原来加1时现在都加4),后面每个数字代表这一级的初始值,原始数组递增满了以后再归零并递增辅助链,辅助链变成“4_33333333”就是满了,穷举结束。以八级每一级0-9穷举为例,原来是循环了一千万次第8级才从0变1,现在这样就能很快使第8级从0变成其它数字。可以更快地扫一遍全局,然后回头再扫,把原来只扫一遍全局变成了分作4**8遍扫,每次递增2则是变成分作2**8遍扫。 随机跳跃式穷举则是把上述的递增4变成随机数,虽然不是完全穷举,但是效果比完全随机好,而且方便多机并行不用划分任务。
有吧友说只能看到我19年后的帖子,所以我把以前的帖子贴图出来 有吧友说只能看到我19年后的帖子,所以我把以前的帖子贴图出来,有兴趣的人可以根据标题检索。吧主手下留情,过几天再删。
解决一个难题,有东西方两大流派。以中西医为例,中医是把所有关 解决一个难题,有东西方两大流派。以中西医为例,中医是把所有关联事物作为一个整体来对待,西医是把各个关联事物都割裂开来,一个一个研究。 我是西医流派的,就像电路维修一样,我强调的是不能同时有两个及以上的未知因素,需要一个个排除,只留一个未知因素后,才能确定是这个未知因素导致故障。 把太多未知因素关联进来,整体解决问题,其实不具备可操作性。要透彻地解决问题,还是需要西医流派的。 分析问题,排除得只剩一个未知因素,其实不难。只要有树状层级的思路。比如说电脑维修,你就先确定是:显示电路问题还是输入输出口问题,还是电脑板问题。这时即使电脑板里面有多个故障,你也可以把它当做一个故障来对待,如果其它组件没问题,那就只要换电脑板就能修好了。如果想做到只换少数零件,那就再把电脑板分割成几个模块分析,就这样一层一层深入。 所以我一贯强调的是“百分之百可解释”,每次都要把待解决问题细分(不断把没把握的问题或者无关的问题割裂开来、放到一边),细分到只剩百分之零点一的未知因素,再把焦点集中于这个未知因素强攻,针尖处的压强无限大,这时候才能强攻成功。 这种思维方法是西方科技赖以成功的关键。西方的思想底蕴还是很讲逻辑的,所以八十年代神经网络学说会被视为“伪科学”,没想到现在美国居然会炼丹术(深度学习)盛行,但是也做不到一统天下,反而是国内全都是没有自己思想的文抄公,清一色捧着洋大爷的神主牌顶礼膜拜。像我这样的“逻辑编程派”是少之又少,当然,对未来谁胜谁负我是淡定的很,喧嚣一时的泡沫总归是要破的。他们折腾了这么多年,连个蠕虫的神经系统都没搞定。一大帮人被忽悠得把人脑神话得无以复加,让他们努力个二十年,撑死了也就达到个人脑水平。殊不知,对我来说,人脑只是一个小目标,更高更快更强的电脑才是永远的目标。
我给我的机器人配上“奥数数列”找规律功能很多年了,好像也没有 我给我的机器人配上“奥数数列”找规律功能很多年了,好像也没有其他人做出类似功能。现在我终于抓住这一类问题的终极大boss了,相比之下,“奥数数列”只是小鱼小虾而已。 机器学习里一个很重要的一个功能就是找出各变量之间的关系,例如上帝告诉你他设置了a~z共26个变量,但是没有告诉你他设置了“a*(3*i^2+b-c)+b*(5*j^3+2*k)”这样一个公式在起作用,我现在就可以依靠部分样本以目前最快的速度穷举出这个公式,不是拟合也不是随机命中。而且为了加快速度,还做到了变量相关概率排序,可以预先排除概率最小的几个变量。 计算机编程的精髓就是暴力穷举出精确公式,而不是瞎蒙。 这个算法主要用于我的机器学习,暂时不会公开。
周五参加小孩成人礼,我的脑子也没闲着,基本想清楚了下面的问题 周五参加小孩成人礼,我的脑子也没闲着,基本想清楚了下面的问题: 自然语言里面经常有多一个词、少一个词不影响语义的情况,例如:“步入婚姻”,“步入婚姻殿堂”,“步入婚姻生活”这三者语义基本相等,现在就想用计算方法来确定。 经过思考,我终于发现了其中的规律—— “婚姻殿堂”,“婚姻生活”的左右词完全被“婚姻”的左右词集合所覆盖,据此可以判断。 上述短语被“殿堂”的左右词集合全覆盖是很正常的,但是被前面定语的左右词集合覆盖就少见,就属于上述情况。 但是上面的名词短语语义还是稍微有点偏差,所以用加上“步入”后的短语对词频稍高的左右词进行统计更加符合。 这个问题又可以延伸为判断“婚姻殿堂”是不是建筑物的问题,因为“婚姻殿堂”右边的词基本上不出现“结构,面积,位置”,所以它不是建筑物,“殿堂”的语义在短语里比重很小。 再对“xx的殿堂”进行总结,发现“心灵的殿堂”,“科学的殿堂”都符合这种情况。所以这种情况实际上可以如此描述:“步入一座殿堂,这座殿堂的名字叫“婚姻”。”。所以这个名词性短语语义等同于“婚姻”。这一类情况可以直接定义为一种规则,便于程序处理。
周五参加小孩成人礼,我的脑子也没闲着,基本想清楚了下面的问题 周五参加小孩成人礼,我的脑子也没闲着,基本想清楚了下面的问题: 自然语言里面经常有多一个词、少一个词不影响语义的情况,例如:“步入婚姻”,“步入婚姻殿堂”,“步入婚姻生活”这三者语义基本相等,现在就想用计算方法来确定。 经过思考,我终于发现了其中的规律—— “婚姻殿堂”,“婚姻生活”的左右词完全被“婚姻”的左右词集合所覆盖,据此可以判断。 上述短语被“殿堂”的左右词集合全覆盖是很正常的,但是被前面定语的左右词集合覆盖就少见,就属于上述情况。 但是上面的名词短语语义还是稍微有点偏差,所以用加上“步入”后的短语对词频稍高的左右词进行统计更加符合。 这个问题又可以延伸为判断“婚姻殿堂”是不是建筑物的问题,因为“婚姻殿堂”右边的词基本上不出现“结构,面积,位置”,所以它不是建筑物,“殿堂”的语义在短语里比重很小。 再对“xx的殿堂”进行总结,发现“心灵的殿堂”,“科学的殿堂”都符合这种情况。所以这种情况实际上可以如此描述:“步入一座殿堂,这座殿堂的名字叫“婚姻”。”。所以这个名词性短语语义等同于“婚姻”。这一类情况可以直接定义为一种规则,便于程序处理。
我发觉我可以提供一个平台,各个编程语言的高手可以在上面构建自己的独立王国。 在野外编程序的时候我是不再愿意带笨重的手提电脑了,今天试了一下用手机加键盘还是很方便的。 据此联想到我可以提供一个平台,各种编程语言的高手们可以用我的小博搭建一个微信群,在这个微信群里可以有这些功能,1、有关这种编程语言的问题,都可以问机器人。2、各种常用模块都可以命令机器人完成,机器人马上就把写好的代码发到群里。3、可以远程连接家里的电脑,发给机器人一串命令,机器人就返回一串文字或者一张截屏图片。 上述功能都可以由我提供免费技术支持,功能1群主只要提供各种技术文档给我装入机器人知识库即可,功能2群主只要一个程序模块写一个问答即可。功能3只要用户在电脑里安装一个软件就可以。初期免费为主,形成生态以后群主可以酌情收费,反正我肯定是以近乎免费的价格提供服务的。
我发觉我可以提供一个平台,各个编程语言的高手可以在上面构建自己独立王国。 在野外编程序的时候我是不再愿意带笨重的手提电脑了,今天试了一下用手机加键盘还是很方便的。 据此联想到我可以提供一个平台,各种编程语言的高手们可以用我的小博搭建一个微信群,在这个微信群里可以有这些功能,1、有关这种编程语言的问题,都可以问机器人。2、各种常用模块都可以命令机器人完成,机器人马上就把写好的代码发到群里。3、可以远程连接家里的电脑,发给机器人一串命令,机器人就返回一串文字或者一张截屏图片。 上述功能都可以由我提供免费技术支持,功能1群主只要提供各种技术文档给我装入机器人知识库即可,功能2群主只要一个程序模块写一个问答即可。功能3只要用户在电脑里安装一个软件就可以。初期免费为主,形成生态以后群主可以酌情收费,反正我肯定是以近乎免费的价格提供服务的。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
2020年最先进的学习模式是什么?就是让机器人代替你看书。你 2020年最先进的学习模式是什么?就是让机器人代替你看书。 你拿到一个大部头的电子书以后,不用自己一页一页去翻读,只要把它上传给我,我把它加入机器人的知识库以后,你就可以去吃喝玩乐了。以后有关这本书的各种问题,你问机器人就可以了,一小半可以直接给你答案,不能直接给你答案的可以给你最相关的段落,你一看就能明白了。重要的是现在自用完全免费,以后你作为该电子书第一提供者还可以享有很多权益。 现在直接给我PDF也可以。
大家欣赏一下最新式的搜索引擎能干些什么?
今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一 今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一种是“我花了8000元买了个苹果”,第二种是“小李很喜欢他的苹果”。这两种都比较难确定“苹果”是水果还是手机?特别是第二种,需要依靠上下文前面的“小李拥有两个手机”来判断,两句话的距离可能比较远,而且要在小李的拥有物之内,把苹果与手机关联起来,人虽然容易做到,电脑想依靠数学或算法来做可真是头痛。还好灵感发现,我五分钟之后就想到了办法。 第一种情形,只要写两个语义正则表达式,“Q:* 苹果 * num 元 * A:num:TP@TOTOAL”,“Q:* num 元 * 苹果 * A:num:TP@TOTOAL”,再用这个模板上语料库搜到八句num数值最接近的句子,再计算所得到的八个整句(TP@TOTOAL)里面所有的名词动词与水果和手机的关联度,可以排除歧义义项了。 第二种情形更复杂一点,就用以下语句训练出一个语义模板: “Q:小明拥有两个手机 A:小明 手机”, “Q:小明买了一个手机 A:小明 手机”, “Q:*送给小明一个手机 A:小明 手机”, “Q:小明手上有两个手机 A:小明 手机”, “Q:*小明的手机* A:小明 手机”, “Q:小朱拥有两个玩具 A:小朱 玩具”, “Q:小朱买了一个玩具 A:小朱 玩具”, “Q:*送给小朱一个玩具 A:小朱 玩具”, “Q:小朱手上有两个玩具 A:小朱 玩具”, “Q:*小朱的玩具* A:小朱 玩具”, 有了这个语义模板以后,遇到可以确定拥有物的语句,就可以输出所有者与拥有物这两个词。用它来处理上下文,就能找到小李的所有拥有物,计算这些拥有物与水果和手机的关联度,可以排除歧义义项了。
今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一 今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一种是“我花了8000元买了个苹果”,第二种是“小李很喜欢他的苹果”。这两种都比较难确定“苹果”是水果还是手机?特别是第二种,需要依靠上下文前面的“小李拥有两个手机”来判断,两句话的距离可能比较远,而且要在小李的拥有物之内,把苹果与手机关联起来,人虽然容易做到,电脑想依靠数学或算法来做可真是头痛。还好灵感发现,我五分钟之后就想到了办法。 第一种情形,只要写两个语义正则表达式,“Q:* 苹果 * num 元 * A:num:TP@TOTOAL”,“Q:* num 元 * 苹果 * A:num:TP@TOTOAL”,再用这个模板上语料库搜到八句num数值最接近的句子,再计算所得到的八个整句(TP@TOTOAL)里面所有的名词动词与水果和手机的关联度,可以排除歧义义项了。 第二种情形更复杂一点,就用以下语句训练出一个语义模板: “Q:小明拥有两个手机 A:小明 手机”, “Q:小明买了一个手机 A:小明 手机”, “Q:*送给小明一个手机 A:小明 手机”, “Q:小明手上有两个手机 A:小明 手机”, “Q:*小明的手机* A:小明 手机”, “Q:小朱拥有两个玩具 A:小朱 玩具”, “Q:小朱买了一个玩具 A:小朱 玩具”, “Q:*送给小朱一个玩具 A:小朱 玩具”, “Q:小朱手上有两个玩具 A:小朱 玩具”, “Q:*小朱的玩具* A:小朱 玩具”, 有了这个语义模板以后,遇到可以确定拥有物的语句,就可以输出所有者与拥有物这两个词。用它来处理上下文,就能找到小李的所有拥有物,计算这些拥有物与水果和手机的关联度,可以排除歧义义项了。
规则、检索才是人类永恒的需求,你们都被忽悠瘸了。
现在可以在机器人里面方便地使用上下文了。
新的近似阅读理解功能,大部分答案都能回答,但是不保证100%正确。 渐渐的你就不要再看大部头的书了,看书这个苦差事慢慢地就可以移交给机器人了。 “阅读理解3”功能,把条件放得更宽。在阅读理解2得不到结果的时候,再调用阅读理解3也能得到比较好的结果。 免费使用,欢迎测试,多提意见。
1
下一页