狼人杀中的动态博弈

狼人杀中的动态博弈

动态博弈是指参与者的行动有先后顺序,而且后行动者可以观察到先行动者的选择,并据此作出相应的选择。狼人游戏实际上是一场标准的动态博弈,所有的玩家(神除外)都是这场动态博弈的参与者。

既然动态博弈是有先后顺序的,那么先行动者和后行动者哪个更具有优势呢?

先行动者的优势在于:先行动者一旦做出选择,后行动者的选择空间就被压缩了。理论上,在游戏开始之前,每个玩家都拥有很多种优势策略,不论选择哪一种对己方阵营都是有利的。但是随着游戏的进行,后行动者的最优策略渐渐被压缩成有限的几种甚至是唯一的一种。

比如,前置位预言家A起跳查杀沉底位狼人C,那么对于A的后置位狼人B而言,“跳预言家查杀A”、“跳预 言家随便给一个人好人身份”、“跳预言家给C一个好人身份”等诸多选择就变成了劣势策略,因为上述几种选择不但不能挽救同伴C,还直接的暴露了自己的狼人身份——在预言家A的身份坐实之后自己可能会被女巫毒死或被大家投票投出去。所以我们认为预言家A的选择压缩了狼人B的策略空间。

后行动者的优势在于:后行动者可以观察到先行动者做出的选择,针对先行动者的选择可以评估形势并制定出当前形势下自己应采取的最优策略。

还是上面那个例子, 狼人B的种种悍跳的冒险玩法被压缩(也可以认为是被狼人B主动剔除)之后,B可以做出更加理性的选择,比如赞同预言家A的立场以求隐藏自己的身份。这样的选择看似平淡无奇,实际上是为被查杀的狼人队友C保留了悍跳的选择空间。

后行动者更加显而易见的优势是沉底位归票,既最后一个发言的玩家可以用有倾向性的分析或煽动性的语言来影响其他玩家的投票结果。但是由于“谁是沉底位”这个问题是由狼人决定的(就算女巫救人造成平安夜 ,发言顺序也是事先商定的),所以沉底位玩家的可信度 天然 被 打了折扣。更有甚者认为“沉底位必有狼”,但是即便如此,沉底位力挽狂澜的例子仍然屡见不鲜。

所谓的“高手”,就是可以在游戏开始之前,就制定好每一个决策点上的策略,即使这个决策点实际上不会出现。

比如之前提到的预言家A,在天黑的时候验出了C的身份是狼人,他当即制订了“跳预言家查杀C”的策略,并考虑了C可能的应对(如“跟A对跳预言家”、“认女巫身份求不被投死”等),而且进一步有针对性的制

定出下一个决策点的最优策略。能做到这一点,我们就有理由认为A是一位玩狼人的高手。

在一个人员相对固定、经常玩狼人的游戏群体中,会形成某些特定的“套路”。比如一种很常见的游戏情景:A跳预言家查杀C,C又跳预言家查杀D,D发言时声称自己是平民。此时,我的朋友们多数人的选择是把D玩家投票出局,然后通过D的身份来判断A和C到底谁是真正的预言家,他们之中说谎的那个极有可能在当天夜里被女巫毒死。在不同的游戏圈子里会有不同的“套路”,用来解决那些经常会出现的情景。比如,我知道有的圈子在上述情景中更倾向于将后跳预言家的C投票出局,这就是他们经常一起玩所形成的“套路”,至于孰优孰劣,我们后面再讨论。

所谓的“套路”,实际上就是每个玩家所选择的策略的组合,并且每个玩家在知道了别人的策略之后仍然不会为自己选择的策略而后悔。这一点很像棋类游戏里的“定式”,比如中国象棋里最常见的开局“当头炮,把马跳”,红方即使知道在自己选择了“当头炮”开局后白方一定会跳马,红方也不会改变自己的策略;相应的,白方在跳马之后通常也不会因为红方下一步的策略而后悔跳了马。在博弈论中,这种双方(或多方)博弈的参与者都不会后悔的策略组合,叫做“纳什均衡”(数学家纳什的故事请参看电影《美丽心灵》)。

对于上述常见情景,我们来分析一下是如何达到现在这种“纳什均衡”的。一开始,我们是没有固定套路的,我们尝试了很多种不同的玩法,比如

把A投出局,把C投出局,把D投出局……后来我们发现,把A投出局是不行的,因为即使A是狼悍跳,直接查杀到预言家C身上的概率比较小(12人标准局中是1/8的概率),所以投A出局是比较冒险的做法。

然后我们尝试了把C投出局的玩法,一旦我们达成了投C出局的共识,那么狼人开局悍跳就成了一种优势策略,因为在狼人未知身份的8个人当中有4个是高贵身份,这样他们就有1/2的概率让一个高贵身份被投票出局。所以后来我们摒弃了这种变相鼓励狼人悍跳的玩法。

再来看把D投出局的玩法,因为D自认平民身份,投D出局应该不会把高贵身份投出局,并且可以判断出A和C谁是真的预言家,所以好人阵营应该可以满意;对于狼人来说,悍跳查杀一个人有1/2的概率找到一个高贵身份,更何况D认平民身份被投票出局相当于替狼人扛了一轮,狼人阵营也应该满意。

达到一种“纳什均衡”并不意味着从此游戏就一成不变了。在一场复杂的博弈当中,“纳什均衡点”通常不止一个,原先的均衡一旦被打破,参与者们会自动寻求新的均衡。

比如某个不平静的下午,狼人阵营尝到了悍跳的甜头,连续获得了几次游戏的胜利,于是原先的均衡就被打破了。好人阵营不再相信在对跳预言家的局势中后跳预言家的那个人,于是本来比较保守的“投D出局”的

策略变成了略显激进的“投C出局”。好人阵营策略的改变迫使狼人阵营不得不相应的改变策略,于是当他们再次被查杀的时候选择了跳女巫或者跳猎人以求不被当场投出局。如果好人阵营普遍认为让冒认身份的狼人被女巫毒死或者被猎人开枪打死也是可以接受的局面,那么新的“纳什均衡”就达成了。

本文系我群群友 耿强 原创,独家授权微信官方公众号 青岛狼人杀 权威发布,转载请注明出处。

狼人杀中的动态博弈

动态博弈是指参与者的行动有先后顺序,而且后行动者可以观察到先行动者的选择,并据此作出相应的选择。狼人游戏实际上是一场标准的动态博弈,所有的玩家(神除外)都是这场动态博弈的参与者。

既然动态博弈是有先后顺序的,那么先行动者和后行动者哪个更具有优势呢?

先行动者的优势在于:先行动者一旦做出选择,后行动者的选择空间就被压缩了。理论上,在游戏开始之前,每个玩家都拥有很多种优势策略,不论选择哪一种对己方阵营都是有利的。但是随着游戏的进行,后行动者的最优策略渐渐被压缩成有限的几种甚至是唯一的一种。

比如,前置位预言家A起跳查杀沉底位狼人C,那么对于A的后置位狼人B而言,“跳预言家查杀A”、“跳预 言家随便给一个人好人身份”、“跳预言家给C一个好人身份”等诸多选择就变成了劣势策略,因为上述几种选择不但不能挽救同伴C,还直接的暴露了自己的狼人身份——在预言家A的身份坐实之后自己可能会被女巫毒死或被大家投票投出去。所以我们认为预言家A的选择压缩了狼人B的策略空间。

后行动者的优势在于:后行动者可以观察到先行动者做出的选择,针对先行动者的选择可以评估形势并制定出当前形势下自己应采取的最优策略。

还是上面那个例子, 狼人B的种种悍跳的冒险玩法被压缩(也可以认为是被狼人B主动剔除)之后,B可以做出更加理性的选择,比如赞同预言家A的立场以求隐藏自己的身份。这样的选择看似平淡无奇,实际上是为被查杀的狼人队友C保留了悍跳的选择空间。

后行动者更加显而易见的优势是沉底位归票,既最后一个发言的玩家可以用有倾向性的分析或煽动性的语言来影响其他玩家的投票结果。但是由于“谁是沉底位”这个问题是由狼人决定的(就算女巫救人造成平安夜 ,发言顺序也是事先商定的),所以沉底位玩家的可信度 天然 被 打了折扣。更有甚者认为“沉底位必有狼”,但是即便如此,沉底位力挽狂澜的例子仍然屡见不鲜。

所谓的“高手”,就是可以在游戏开始之前,就制定好每一个决策点上的策略,即使这个决策点实际上不会出现。

比如之前提到的预言家A,在天黑的时候验出了C的身份是狼人,他当即制订了“跳预言家查杀C”的策略,并考虑了C可能的应对(如“跟A对跳预言家”、“认女巫身份求不被投死”等),而且进一步有针对性的制

定出下一个决策点的最优策略。能做到这一点,我们就有理由认为A是一位玩狼人的高手。

在一个人员相对固定、经常玩狼人的游戏群体中,会形成某些特定的“套路”。比如一种很常见的游戏情景:A跳预言家查杀C,C又跳预言家查杀D,D发言时声称自己是平民。此时,我的朋友们多数人的选择是把D玩家投票出局,然后通过D的身份来判断A和C到底谁是真正的预言家,他们之中说谎的那个极有可能在当天夜里被女巫毒死。在不同的游戏圈子里会有不同的“套路”,用来解决那些经常会出现的情景。比如,我知道有的圈子在上述情景中更倾向于将后跳预言家的C投票出局,这就是他们经常一起玩所形成的“套路”,至于孰优孰劣,我们后面再讨论。

所谓的“套路”,实际上就是每个玩家所选择的策略的组合,并且每个玩家在知道了别人的策略之后仍然不会为自己选择的策略而后悔。这一点很像棋类游戏里的“定式”,比如中国象棋里最常见的开局“当头炮,把马跳”,红方即使知道在自己选择了“当头炮”开局后白方一定会跳马,红方也不会改变自己的策略;相应的,白方在跳马之后通常也不会因为红方下一步的策略而后悔跳了马。在博弈论中,这种双方(或多方)博弈的参与者都不会后悔的策略组合,叫做“纳什均衡”(数学家纳什的故事请参看电影《美丽心灵》)。

对于上述常见情景,我们来分析一下是如何达到现在这种“纳什均衡”的。一开始,我们是没有固定套路的,我们尝试了很多种不同的玩法,比如

把A投出局,把C投出局,把D投出局……后来我们发现,把A投出局是不行的,因为即使A是狼悍跳,直接查杀到预言家C身上的概率比较小(12人标准局中是1/8的概率),所以投A出局是比较冒险的做法。

然后我们尝试了把C投出局的玩法,一旦我们达成了投C出局的共识,那么狼人开局悍跳就成了一种优势策略,因为在狼人未知身份的8个人当中有4个是高贵身份,这样他们就有1/2的概率让一个高贵身份被投票出局。所以后来我们摒弃了这种变相鼓励狼人悍跳的玩法。

再来看把D投出局的玩法,因为D自认平民身份,投D出局应该不会把高贵身份投出局,并且可以判断出A和C谁是真的预言家,所以好人阵营应该可以满意;对于狼人来说,悍跳查杀一个人有1/2的概率找到一个高贵身份,更何况D认平民身份被投票出局相当于替狼人扛了一轮,狼人阵营也应该满意。

达到一种“纳什均衡”并不意味着从此游戏就一成不变了。在一场复杂的博弈当中,“纳什均衡点”通常不止一个,原先的均衡一旦被打破,参与者们会自动寻求新的均衡。

比如某个不平静的下午,狼人阵营尝到了悍跳的甜头,连续获得了几次游戏的胜利,于是原先的均衡就被打破了。好人阵营不再相信在对跳预言家的局势中后跳预言家的那个人,于是本来比较保守的“投D出局”的

策略变成了略显激进的“投C出局”。好人阵营策略的改变迫使狼人阵营不得不相应的改变策略,于是当他们再次被查杀的时候选择了跳女巫或者跳猎人以求不被当场投出局。如果好人阵营普遍认为让冒认身份的狼人被女巫毒死或者被猎人开枪打死也是可以接受的局面,那么新的“纳什均衡”就达成了。

本文系我群群友 耿强 原创,独家授权微信官方公众号 青岛狼人杀 权威发布,转载请注明出处。


相关内容

  • 论静态与动态博弈中的逻辑推理
  • 吴新民 摘要:博弈研究的目的是揭示人们互动行为的逻辑规律.不论是双主体的零和博弈与多主体的非零和博弈,还是不完美信息的静态.动态博弈与完美信息的静态.动态博弈,它们的实质都是策略分析与逻辑推理的运用.文章在简要介绍蓬勃兴起的博弈逻辑基础上,论述了静态博弈与动态博弈中的逻辑推理. 人类的所有活动,一般 ...

  • 演化博弈论研究的现状与展望
  • 知识丛林 演化博弈论研究的现状与展望 王文宾 (东南大学经济管理学院,南京211189) 摘 要:文章从国内.国外两个角度分别论述了演化博弈论的研究进展.主要讨论了演化博弈 论的理论渊源.研究现状与面临的挑战,比较了国内外演化博弈论研究的差异,并展望了演化博弈论未来的研究方向. 关键词:博弈论:演化 ...

  • 国际贸易问题-10
  • <国际贸易问题>第 10期经贸论坛论倾销与反倾销动态博弈中可信性问题1刘琦南京理工大学经管院应用经济系摘要:在国际贸易中,反倾销作为一种保护公平贸易的措施被写进了各国的法律和国际协定之中,从法律本身意义上来说,反倾销应该是一种防御性的工具:但是从动态博弈的角度上看,一个可信的威胁也可以使 ...

  • 博弈论的分类
  • 须要求博弈方互相认识彼此的决策行为,即每个参与者都能预见其他参与者的均衡策略.当一个博弈中的参与者达到纳什均衡状态时,任何一个参与者都不能独自的改变本身的策略行为以增大自身的收益而不影响其他参与者的策略行为.因此,纳什均衡表示的是博弈的稳态性,一旦达到纳什均衡状态,表明该博弈各个参与者之间达到均衡状 ...

  • 11第十一章扩展型博弈与子博弈精炼
  • 第十一章扩展型博弈与子博弈精炼上一章讨论了完全信息静态博弈,本章讨论完全信息动态博弈. 本章的核心内容是: 动态博弈→静态博弈 11.1扩展型博弈的表达式 一.博弈的扩展形式 1.概念 在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动). 在动态博弈中,参与人 ...

  • 第三章 信息经济学研究方法总结
  • 第三章 信息经济学研究方法 信息经济学以信息行为.信息行为的外部性和信息经济为研究对象,从而具有独立的研究领域和较为稳定的研究范畴,并形成共同的理论观念,是经济学体系的成员之一. 信息经济学的方法离不开经济学分析的两大基本方法:规范分析.实证分析 第一节 规范研究与实证研究 一.信息经济学的规范研究 ...

  • 政产学研协同创新的演化博弈分析
  • 2013年8月第4期 政产学研协同创新的演化博弈分析 王子龙 1 许箫迪 2 (1南京航空航天大学经济与管理学院,南京210016:2南京师范大学公共管理学院,南京210097) 摘要:从博弈双方有限理性的假设前提出发,在研究纯市场行为产学研协同创新的基础上,引入政府行为,构建 政产学研协同创新的演 ...

  • 博弈论名词解释
  • 1. 零和博弈:博弈方之间利益的总和为零,也称"严格竞争博弈".博弈方之 间利益始终对立,偏好通常不同. -猜硬币,田忌赛马,石头-剪刀-布 2. 常和博弈:博弈方之间利益的总和为常数.博弈方之间的利益是对立的且是 竞争关系. -几个人共同分配固定数额的奖金.利润,遗产官司 3. ...

  • 西方产业组织学最新研究方法综述
  • (双月刊)2008年第4期(总第35期) 综述 □(河南大学黄河文明与可持续发展研究中心,河南开封 475001) 摘要:西方产业组织学作为现代经济学的一个重要组成部分,有其稳定的分 析框架和研究方法.本文从研究方法角度对其进行了梳理,分析了推理学派与 实证学派各自研究方法的最新进展,研究表明:在推 ...

  • 完全信息动态博弈下反倾销政策比较
  • 摘要:通过在完全动态博弈条件下建立基于实现社会福利最大化的反倾销税与反倾销补贴的优化模型,对采取反倾销税和反倾销补贴政策对本国经济福利所产生的影响进行比较,接着分析了影响反倾销措施选择的因素,最后对于我国政府提供政策建议. 关键词:完全信息动态博弈:反倾销税:反倾销补贴 中图分类号:F74文献标识码 ...