关于阿发狗的搜索深度问题
围棋吧
全部回复
仅看楼主
level 11
quicker1 楼主
之前以为是固定计算一个深度,比如20步,又看了一下那个论文,
https://psv4.vk.me/c404831/u39114/docs/08ca56db8187/Mastering_the_game_of_Go_with_deep_neural_networks_and_tree_search.pdf
发现好像并不是这样。
搜索的深度还是取决于策略网络给出的选点多少、用时限制、计算机性能等几个的综合。
论文里有一幅图,图f是从MCTS树里给出来的最大胜率走棋建议,这里一共算了27步
d图可以看出,在这个局面,策略网络给出的选点并不多
还有一个图比较有意思,关于阿发狗几个组成部分各自的预测方差的,可以看到,前100手,预测的方差都比较大
2016年03月15日 02点03分 1
level 11
quicker1 楼主
由此可以想到,如果某个分支十分复杂,它的策略网络有盲点,或者给出的选点很多导致搜索深度不够,而这个分支又决定了胜负,那么它就懵逼了。
2016年03月15日 02点03分 3
level 11
quicker1 楼主
[阴险],所以,推翻之前的猜测,应该时越上能干挺它,蜗壳估计有危险
2016年03月15日 02点03分 4
1