周一处 周一处
可怜枫江夜半雨,一点渔火一声钟
关注数: 22 粉丝数: 163 发帖数: 5,209 关注贴吧数: 13
到了说离别的时候了,本想就这么悄悄的走开,后来还是说服自己总结几句: 1.缘起 我是七岁开始学棋,家在10线小城,身边没有老师指导,全凭自己兴趣,翻开不知道哪里搜罗来的围棋入门册,自己琢磨观人下棋, 2.学棋 等开始下赢大人了,父亲才开始支持我,记得买的第一本棋书是过惕生先生的《围棋死活300例》,一晃两三年,做题和下棋让自己慢慢提高,一次市级比赛,碰着好运气居然得了第四,然而以后繁重的学业断绝了我潜心下棋的之路; 进入中学,填鸭教育下,只能和几个好友偶尔练练,菜鸡互啄下,倒也乐趣无穷; 顺利考入大学,下棋少,摆棋却多起来了,一是每期体坛周报的一角棋谱总被我精心裁下,一是买的棋书越来越高大上,顺便搭一句我的专业是人工智能和图像识别,当年从业者寥寥,就业也不热门,哪像现在起步吓死人 3.复燃 走入社会,成为北漂,棋是彻底放下了,但自己数次朝拜圣地,或乘车或遛弯到棋院,那里有京城最好吃的糖炒板栗和京城最小的便宜坊。 以为和围棋就只是这样相忘于江湖了…… 直到16年初,谷歌的alphago论文横空出世,第一时间看完文章,全身颤抖下发了朋友圈,感慨学业世事,千里之外的中学棋友遥遥相和,俩人又像回到初中一样,认真复盘alphago—fan的对局,一致认定留给李世石的时间不多了; 为此,投身于变革的时代,追谱追视频,贴吧也一阵热火朝天,无论是与夜里寻猪对战,还是master数人头,又或是棋力差距论辩,虽无聊却真的激情澎湃; 4.平淡 我还是会继续下棋、摆棋、看棋,但再不会有惊心动魄的围棋了,真的只是游戏了 天下没有不散的筵席,与围棋也好,与围棋吧也罢,岁月已带走了轻狂,是到了最终放下的时候了…… 最后附上的是那石破天惊的alphgo棋谱,感谢deepmind,感谢这个时代
星阵表态:星阵是AlphaGo技术演进 星阵围棋董事长金涬博士致词,介绍了星阵围棋的特点以及公司未来的在围棋行业里的愿景。 AlphaGo是目前世界上最强的围棋程序,尤其是第二篇的AlphaGo Zero的论文,通过强化学习技术,把围棋人工智能的水平提高到相当高的水平,但这种算法消耗资源量空前巨大。需要2000个TPU自我对弈,每个每小时租金6.5美金,每天就是31万美金……这对很多研究围棋人工智能的团队来说是个天文数字,有些就终止了研发。 我们认为再消耗这么大的资源去验证一个已经被证明的算法,没有太多技术价值,所以选择了另外一条路。我们在特征体系、模型结构和MCTS算法架构,已经取得了一些初步的成果,可以认为是对Alphago向前的技术演进。我们的研究希望能够降低训练的资源需求量,完成模型学习,更有价值的是,通过我们的创新,能够下出不一样的围棋。有些团队一味跟进AlphaGo的论文,但架构和风格都相似,最后下出来的围棋也是大同小异。 我们想下出:优势下不退让的围棋,贴任意目数的围棋,下出任意棋盘路数的围棋,九路,十三路,甚至是十八路,二十路。这些工作其实已经超越了AlphaGo的架构。AlphaGo虽然功成身退了,但围棋的奥秘远远没有解开,围棋人工智能的创新和探索也不会停止。我们新的算法在围棋人工智能实验成熟后,希望能够迁移到其他体系,并有很强的实用性。
终于来了九阴真经下篇,alphago zero登场! 【可以自学成才的AlphaGo Zero】本周Deepmind在《自然》发表的一篇论文Mastering the game of Go without human knowledge,一款新版的AlphaGo计算机程序能够从空白状态起,在不需要任何人类输入的条件下,迅速自学围棋。这款新程序名叫AlphaGo Zero,以100比0的战绩打败了它的前任(在2016年3月的锦标赛中,其前任打败了围棋冠军Lee Sedol)。 人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军,科学家在训练上一款AlphaGo时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。那款AlphaGo的训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。 本文中,David Silver, Julian Schrittwieser, Karen Simonyan, Demis Has****s和同事介绍了AlphaGo Zero,它的学习从零开始,且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子,没有任何人类数据。AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。 通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。随着程序训练的进行,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解
1 下一页