星阵表态:星阵是AlphaGo技术演进
围棋吧
全部回复
仅看楼主
level 12
周一处 楼主
星阵围棋董事长金涬博士致词,介绍了星阵围棋的特点以及公司未来的在围棋行业里的愿景。
AlphaGo是目前世界上最强的围棋程序,尤其是第二篇的AlphaGo Zero的论文,通过强化学习技术,把围棋人工智能的水平提高到相当高的水平,但这种算法消耗资源量空前巨大。需要2000个TPU自我对弈,每个每小时租金6.5美金,每天就是31万美金……这对很多研究围棋人工智能的团队来说是个天文数字,有些就终止了研发。
我们认为再消耗这么大的资源去验证一个已经被证明的算法,没有太多技术价值,所以选择了另外一条路。我们在特征体系、模型结构和MCTS算法架构,已经取得了一些初步的成果,可以认为是对Alphago向前的技术演进。我们的研究希望能够降低训练的资源需求量,完成模型学习,更有价值的是,通过我们的创新,能够下出不一样的围棋。有些团队一味跟进AlphaGo的论文,但架构和风格都相似,最后下出来的围棋也是大同小异。
我们想下出:优势下不退让的围棋,贴任意目数的围棋,下出任意棋盘路数的围棋,九路,十三路,甚至是十八路,二十路。这些工作其实已经超越了AlphaGo的架构。AlphaGo虽然功成身退了,但围棋的奥秘远远没有解开,围棋人工智能的创新和探索也不会停止。我们新的算法在围棋人工智能实验成熟后,希望能够迁移到其他体系,并有很强的实用性。
2018年04月18日 09点04分 1
level 12
周一处 楼主
转自新浪的棋牌新闻
2018年04月18日 09点04分 2
level 12
周一处 楼主
如果是真的目标是优势不退等,那显然增加了特征值,如何在增加维度的同时降低运算样本,保持水平不降,确实是很有工程意义的
2018年04月18日 09点04分 4
level 12
周一处 楼主
记者:请问星阵的算法与AlphaGo最基本的差异。
金涬:两个差别,第一我们在模型结构,特征的表达,训练的方法,MTCS架构上都有一些区别,这些区别让我们跟AlphaGo李世石版本相比,水平有所提升;第二,我们没有使用AlphaGo第二篇论文的强化学习技术。我们主要是从人类棋谱进行数据学习,棋风很像人类,能够被人类理解,但水平也相当厉害,而且会更容易被广大棋友理解。
2018年04月18日 09点04分 6
level 12
周一处 楼主
划重点,目前官方认可棋力高于alpha lee
2018年04月18日 09点04分 7
应该还不到绝艺的水平
2018年04月18日 09点04分
1