level 11
quicker1
楼主
之前以为是固定计算一个深度,比如20步,又看了一下那个论文,
https://psv4.vk.me/c404831/u39114/docs/08ca56db8187/Mastering_the_game_of_Go_with_deep_neural_networks_and_tree_search.pdf
发现好像并不是这样。
搜索的深度还是取决于策略网络给出的选点多少、用时限制、计算机性能等几个的综合。
论文里有一幅图,图f是从MCTS树里给出来的最大胜率走棋建议,这里一共算了27步

d图可以看出,在这个局面,策略网络给出的选点并不多
还有一个图比较有意思,关于阿发狗几个组成部分各自的预测方差的,可以看到,前100手,预测的方差都比较大

2016年03月15日 02点03分
1
https://psv4.vk.me/c404831/u39114/docs/08ca56db8187/Mastering_the_game_of_Go_with_deep_neural_networks_and_tree_search.pdf
发现好像并不是这样。
搜索的深度还是取决于策略网络给出的选点多少、用时限制、计算机性能等几个的综合。
论文里有一幅图,图f是从MCTS树里给出来的最大胜率走棋建议,这里一共算了27步

d图可以看出,在这个局面,策略网络给出的选点并不多还有一个图比较有意思,关于阿发狗几个组成部分各自的预测方差的,可以看到,前100手,预测的方差都比较大
