吧务
level 13
0grandiose0
楼主
从小到大呢,我都是一个比较喜欢玩游戏的人,不管是电子游戏还是桌游,都玩过很多。我属于那种特别喜欢研究游戏策略,热爱通过合理的战术和规划取得胜利的人,每当在游戏中面临多个策略选择时,我都会三思而后行,尽量做出最佳的选择。有的时候也会和别人讨论甚至争执怎样的决策才是最好的,每当这种时候我都会思考,究竟怎么样才能做出更好的决定?
事实上,每个双人或多人参与的对抗游戏,比如象棋、英雄联盟、德州扑克,都可以视作是一场博弈。我们想知道如何做出更好的决定,那我们首先就要知道什么是好的决定,什么是坏的决定,评判决策的标准是什么?这其实就已经牵涉到了决策学的内容,本文并无意深究,只是想提供一个科学地评判决策质量的一个视角。
首先,总的来说,博弈可以分为两种,完全信息博弈和非完全信息博弈。前者就是双方玩家没有任何隐藏信息的游戏,所有信息都公开在明处,双方玩家随时都可以获取到全部的信息,比如说象棋、围棋就是典型代表,要注意判断的条件是是否有隐藏信息,而不是游戏是否有随机性,比如投骰子比大小是完全信息博弈,石头剪刀布是非完全信息博弈。这类博弈难度可以很高,但思考方式是很简洁明了的。如果没有随机因素,就是不断地在脑海中演算未来会出现的情况,也即下棋俗语“算棋”;如果有随机因素,那就仔细评估各个选择背后的概率以及期望,做出最有利于自己的决定。然而,这部分博弈只占非常非常少的一部分,我们玩的绝大多数游戏,甚至生活中工作中会碰到的博弈,都是非完全信息博弈,这也就是本文的重点,如何评判非完全信息博弈中的决策质量。
首先,我们需要引入一个概念,英文叫equity,中文我觉得叫权益比较合适。简单来说,权益就是你的胜率加上平局概率的一半,比如在一个双人博弈中,你有25%的胜率和50%的平局率,那你和对方的权益就都是50%,相当于这是一个势均力敌的结果。也就是说,权益是用来评估一个玩家在博弈中的优势程度的,权益越高代表越有优势,反之亦然。
说完了权益,我们就可以引入非完全信息博弈中的核心概念了,即Game Theory Optimal,游戏理论最优解(下文简写为GTO)。其定义为如果玩家A采取了某一策略,使得博弈中的任何其他玩家都无法单方面地削弱A的权益,并且A也无法再单方面地提高自己的权益,此时A采取的即是GTO策略。简单地来说,单方面地把自己的权益最大化,就是GTO。先举个最简单的例子,剪刀石头布中,GTO是什么?换句话说,不管对方出什么,我用什么策略,一定能获得50%的权益?想思考的读者可以自己想一会再下拉,不想的话可以直接拉到后面。

2018年03月29日 09点03分
1
事实上,每个双人或多人参与的对抗游戏,比如象棋、英雄联盟、德州扑克,都可以视作是一场博弈。我们想知道如何做出更好的决定,那我们首先就要知道什么是好的决定,什么是坏的决定,评判决策的标准是什么?这其实就已经牵涉到了决策学的内容,本文并无意深究,只是想提供一个科学地评判决策质量的一个视角。
首先,总的来说,博弈可以分为两种,完全信息博弈和非完全信息博弈。前者就是双方玩家没有任何隐藏信息的游戏,所有信息都公开在明处,双方玩家随时都可以获取到全部的信息,比如说象棋、围棋就是典型代表,要注意判断的条件是是否有隐藏信息,而不是游戏是否有随机性,比如投骰子比大小是完全信息博弈,石头剪刀布是非完全信息博弈。这类博弈难度可以很高,但思考方式是很简洁明了的。如果没有随机因素,就是不断地在脑海中演算未来会出现的情况,也即下棋俗语“算棋”;如果有随机因素,那就仔细评估各个选择背后的概率以及期望,做出最有利于自己的决定。然而,这部分博弈只占非常非常少的一部分,我们玩的绝大多数游戏,甚至生活中工作中会碰到的博弈,都是非完全信息博弈,这也就是本文的重点,如何评判非完全信息博弈中的决策质量。
首先,我们需要引入一个概念,英文叫equity,中文我觉得叫权益比较合适。简单来说,权益就是你的胜率加上平局概率的一半,比如在一个双人博弈中,你有25%的胜率和50%的平局率,那你和对方的权益就都是50%,相当于这是一个势均力敌的结果。也就是说,权益是用来评估一个玩家在博弈中的优势程度的,权益越高代表越有优势,反之亦然。
说完了权益,我们就可以引入非完全信息博弈中的核心概念了,即Game Theory Optimal,游戏理论最优解(下文简写为GTO)。其定义为如果玩家A采取了某一策略,使得博弈中的任何其他玩家都无法单方面地削弱A的权益,并且A也无法再单方面地提高自己的权益,此时A采取的即是GTO策略。简单地来说,单方面地把自己的权益最大化,就是GTO。先举个最简单的例子,剪刀石头布中,GTO是什么?换句话说,不管对方出什么,我用什么策略,一定能获得50%的权益?想思考的读者可以自己想一会再下拉,不想的话可以直接拉到后面。



