level 12
上节课我们学习了非常著名的博弈,囚徒困境,并推导了三个重要结论。不过我们还并没有真正的入门,因为在这之前,我要讲一点比较枯燥的东西,那就是博弈论的一些术语
一个博弈由哪些部分组成呢?首先,博弈需要参与人(player)通常,我们用下标i j等字母来区分不同的参与人
其次,我们需要策略(strategy)策略是参与人的所有可能选择。我们之前接触的策略均是不连续的,而有些策略是可以像函数一样连续的,我们以后都将接触到。通常策略都用s来表示,需要注意的是,如果si表示参与人i的策略,那么s-i则表示除了参与人i所有其他的策略
最后,也是最重要的,我们需要收益(payoff)收益是直接影响你抉择的因素,因为通常情况下我们都是在追求收益最大化,所以我们会追求收益最大的策略。收益使用字母U表示,如Ui表示参与人i的收益
2019年11月11日 07点11分
2
level 12
之所以介绍这些,主要是方便以后的一些表述更加简洁。要知道博弈论是需要思考和计算的,这是非常需要数学能力的,所以如果以后看见了函数和微积分请不要头大
那么现在开始我们还是来看点轻松的吧,来分析一个案例
假设A国想要入侵B国,通往B国的路有两条,一条是容易走的,一条是很难走的。现在两国的将领各有两个选择,即选择防守或进攻一条道路,且不能分兵。现在进行规定:如果进攻部队遭遇防守部队,他们损失一个单位战斗力。如果选择进攻难走的道路,同样损失一个单位战斗力。你将如何做出选择?
根据题意我们先画出如下矩阵:
e h
E (1,-1) (1,-1)
H (0,0) (2,-2)
如图所示,如果防守了正确地方,那么敌方损失一个单位战斗力。如果敌方走难走的路,同样需要损失一个战斗力。这个收益我想应该不用过多解释,我这里想提的是这其实是一个典型的零和博弈。什么是零和博弈?很简单,双方收益加起来一定为零。之前的囚徒困境这种我们则称为非零和博弈,因为收益相加并不为零。零和博弈在生活中非常常见,比如棋类,一个人输那么另一个肯定赢,除非平局
那么这个博弈中,作为防守方应该如何选择呢?如果你还记得上一讲的最后一个案例,你会发现和那个一样,当我们作为防守方时并没有严格优势策略。如果对方选择eE更好,如果对方选择h则H更好。简单来说,能截到对方军队就是更好的
那么同样的,如果你还记得上一讲的结论,那你就知道此时我们应该进行换位思考。如果我是进攻方,对方选择E那么无论哪个都损失一个单位兵,而如果对方选择H那么进攻e显然更好。所以总的来说进攻方应该选择e,因为如果对方就算防守也只损失一个单位,如果不防守则可以毫发无损。但如果选择h首先就要掉一个单位,如果被防守了甚至要掉两个,显然是不合算的。所以进攻方会进攻e,因此如果能预测到这一点,很显然防守方也应该选择E了
2019年11月11日 08点11分
3
level 12
需要注意的是,这里我们很大程度简化了问题,比如不让分兵。实际上军队打仗是个很复杂事情,考虑的东西非常多。所以如果你现实中这么操作被灭国了不要来找我,我不负责
在这个博弈中我们还可以注意到一件事情,那就是出现了在某种情况下无论如何选择收益都完全相同。用术语表示那就是,当si=E时,Uje=Ujh。同时我们还可以发现,当si=H时,Uje>Ujh。因此总的来说,Uje
≥Ujh。在这种情况下,我们称h为弱劣势策略(weakly dominated strategy)这里我就不写定义了,因为它和隔壁那个的区别就是多一个等于
和严格劣势策略一样,我们也不应该选择弱劣势策略,原因应该就不用证明了
那么作为今天最后一个内容,我们来玩一个数字游戏
假设有很多人玩一个数字游戏,规则是选择一个数字,尽可能接近平均数的三分之二,最接近的人获胜,可以有多个胜利者。现在我们同时假设所有人是理性人,且互相知道彼此是理性人,那么这个时候这个数字会是多少?
2019年11月11日 08点11分
4
level 12
上一楼忘记说一个条件了,要从1到100里选择整数,这里补上,注意一下
为了防止有人看不懂规则,先来举个例子。比如有三个人,分别选择了30 90 15,那么平均数是45,45的三分之二是30因此30直接获胜
那么在所有人都是理性人且互相知道这种情况下,答案会是多少呢?这种情况就需要我们来一步步分析了。首先,我们可以肯定这个数不可能是67以上的数字。为什么呢?因为即使所有人都选择100,平均数是100,平均数三分之二是66.7,这时选择67会胜利。因此无论什么情况下,67以上的数字都不会赢得比赛,因为67是最大的极限
那么既然每个人都是理性人,每个人都应该考虑到了这一点,因此我可以大胆断定45以上的数字也不会是。为什么?因为既然所有人都不会选择67以上的数字,因此现在的极限变成了67,因此现在平均数的三分之二的极限也会变成67的三分之二,45左右
那么再往下推导,45以上的数字没有人选了,所以这个极限进一步变成了30。我们可以发现,这个极限会不断地被乘三分之二,越来越小,到最后就只剩下了一个答案,那就是1
所以最后,在极端的条件下,会出现所有人都选择1,且都获得胜利。之所以说这是极端的,是因为现实生活中不全是理性人。在耶鲁大学历年做得实验中,这个最终的答案有非常多,最小的有9,最大的甚至到了23,但没有一次真的是1的
所以在现实生活中获胜的要素是什么呢?除了靠我们刚刚的推导以外,剩下的基本上只能靠运气了,因为你不知道到底有多少人是理性人,有多少人是认真思考的,有多少人是瞎选的。不过有一点我们可以确定,那就是人群越聪明,平均数越小,因为人群越聪明,他们就越会尽可能地进行上面的推导,并最终会选择比较小的数字,因此总体的平均数也会小。而如果你和一群随机数生成器玩,我建议你还是33吧
这个博弈分析的具体原理我们下节课会进一步研究,但在这里我更想说一说这个博弈成立的关键,那就是理性度(Rationality)出现1的条件不仅仅是所有人是理性人这么简单,而是要所有人都知道所有人是理性人,而且所有人都知道所有人知道所有人是理性人,直到一个无限循环。简单来说,那就是要求理性度是所有人的共同知识(Common knowledge)
我想提一点的是,共同知识是个很复杂的概念,你不一定真的弄得懂什么才是共同知识。举个例子,现在有两个人,每个人头上都有一顶绿帽子,但是每个人都不知道自己头上是什么帽子。现在我们可以说,“至少一个人戴着绿帽子”是共同知识吗
你可能认为,虽然两个人不知道自己是什么帽子,但他们都知道对方是绿帽子,所以都可以推导出至少一个人有绿帽子,因此这是共同知识。真的是这样吗?其实并不是。虽然每个人都知道对方是绿帽子,但他们不知道对方知不知道自己知不知道对方是绿帽子。也就是说,对于甲,他可能会觉得自己戴的是粉色帽子,因此乙无法得出这个结论,对于乙同样如此。所以这并不是真正的共同知识,因为它不是两个人的共识,而是双方自己得出的结论
之所以要讲一个绿帽子的事情,是为了更进一步强调共同知识成立的严格条件。不是所有人是理性人,也不是所有人知道所有人是理性人,而是所有人知道所有人知道所有人是理性人,而且所有人知道所有人知道所有人知道所有人是理性人,直到无尽地类推。请注意,虽然这个条件非常严格,但它也是博弈论的基础之一,因为我们大部分的情况都是在这种严格的条件下才成立的
以上就是这一讲的内容,我们下节课再见
2019年11月11日 09点11分
5