狼人杀中的动态博弈

动态博弈是指参与者的行动有先后顺序，而且后行动者可以观察到先行动者的选择，并据此作出相应的选择。狼人游戏实际上是一场标准的动态博弈，所有的玩家（神除外）都是这场动态博弈的参与者。

既然动态博弈是有先后顺序的，那么先行动者和后行动者哪个更具有优势呢？

先行动者的优势在于：先行动者一旦做出选择，后行动者的选择空间就被压缩了。理论上，在游戏开始之前，每个玩家都拥有很多种优势策略，不论选择哪一种对己方阵营都是有利的。但是随着游戏的进行，后行动者的最优策略渐渐被压缩成有限的几种甚至是唯一的一种。

比如，前置位预言家A起跳查杀沉底位狼人C，那么对于A的后置位狼人B而言，“跳预言家查杀A”、“跳预言家随便给一个人好人身份”、“跳预言家给C一个好人身份”等诸多选择就变成了劣势策略，因为上述几种选择不但不能挽救同伴C，还直接的暴露了自己的狼人身份——在预言家A的身份坐实之后自己可能会被女巫毒死或被大家投票投出去。所以我们认为预言家A的选择压缩了狼人B的策略空间。

后行动者的优势在于：后行动者可以观察到先行动者做出的选择，针对先行动者的选择可以评估形势并制定出当前形势下自己应采取的最优策略。

还是上面那个例子，狼人B的种种悍跳的冒险玩法被压缩（也可以认为是被狼人B主动剔除）之后，B可以做出更加理性的选择，比如赞同预言家A的立场以求隐藏自己的身份。这样的选择看似平淡无奇，实际上是为被查杀的狼人队友C保留了悍跳的选择空间。

后行动者更加显而易见的优势是沉底位归票，既最后一个发言的玩家可以用有倾向性的分析或煽动性的语言来影响其他玩家的投票结果。但是由于“谁是沉底位”这个问题是由狼人决定的（就算女巫救人造成平安夜，发言顺序也是事先商定的），所以沉底位玩家的可信度天然被打了折扣。更有甚者认为“沉底位必有狼”，但是即便如此，沉底位力挽狂澜的例子仍然屡见不鲜。

所谓的“高手”，就是可以在游戏开始之前，就制定好每一个决策点上的策略，即使这个决策点实际上不会出现。

比如之前提到的预言家A，在天黑的时候验出了C的身份是狼人，他当即制订了“跳预言家查杀C”的策略，并考虑了C可能的应对（如“跟A对跳预言家”、“认女巫身份求不被投死”等），而且进一步有针对性的制

定出下一个决策点的最优策略。能做到这一点，我们就有理由认为A是一位玩狼人的高手。

在一个人员相对固定、经常玩狼人的游戏群体中，会形成某些特定的“套路”。比如一种很常见的游戏情景：A跳预言家查杀C，C又跳预言家查杀D，D发言时声称自己是平民。此时，我的朋友们多数人的选择是把D玩家投票出局，然后通过D的身份来判断A和C到底谁是真正的预言家，他们之中说谎的那个极有可能在当天夜里被女巫毒死。在不同的游戏圈子里会有不同的“套路”，用来解决那些经常会出现的情景。比如，我知道有的圈子在上述情景中更倾向于将后跳预言家的C投票出局，这就是他们经常一起玩所形成的“套路”，至于孰优孰劣，我们后面再讨论。

所谓的“套路”，实际上就是每个玩家所选择的策略的组合，并且每个玩家在知道了别人的策略之后仍然不会为自己选择的策略而后悔。这一点很像棋类游戏里的“定式”，比如中国象棋里最常见的开局“当头炮，把马跳”，红方即使知道在自己选择了“当头炮”开局后白方一定会跳马，红方也不会改变自己的策略；相应的，白方在跳马之后通常也不会因为红方下一步的策略而后悔跳了马。在博弈论中，这种双方（或多方）博弈的参与者都不会后悔的策略组合，叫做“纳什均衡”（数学家纳什的故事请参看电影《美丽心灵》）。

对于上述常见情景，我们来分析一下是如何达到现在这种“纳什均衡”的。一开始，我们是没有固定套路的，我们尝试了很多种不同的玩法，比如

把A投出局，把C投出局，把D投出局……后来我们发现，把A投出局是不行的，因为即使A是狼悍跳，直接查杀到预言家C身上的概率比较小（12人标准局中是1/8的概率），所以投A出局是比较冒险的做法。

然后我们尝试了把C投出局的玩法，一旦我们达成了投C出局的共识，那么狼人开局悍跳就成了一种优势策略，因为在狼人未知身份的8个人当中有4个是高贵身份，这样他们就有1/2的概率让一个高贵身份被投票出局。所以后来我们摒弃了这种变相鼓励狼人悍跳的玩法。

再来看把D投出局的玩法，因为D自认平民身份，投D出局应该不会把高贵身份投出局，并且可以判断出A和C谁是真的预言家，所以好人阵营应该可以满意；对于狼人来说，悍跳查杀一个人有1/2的概率找到一个高贵身份，更何况D认平民身份被投票出局相当于替狼人扛了一轮，狼人阵营也应该满意。

达到一种“纳什均衡”并不意味着从此游戏就一成不变了。在一场复杂的博弈当中，“纳什均衡点”通常不止一个，原先的均衡一旦被打破，参与者们会自动寻求新的均衡。

比如某个不平静的下午，狼人阵营尝到了悍跳的甜头，连续获得了几次游戏的胜利，于是原先的均衡就被打破了。好人阵营不再相信在对跳预言家的局势中后跳预言家的那个人，于是本来比较保守的“投D出局”的

策略变成了略显激进的“投C出局”。好人阵营策略的改变迫使狼人阵营不得不相应的改变策略，于是当他们再次被查杀的时候选择了跳女巫或者跳猎人以求不被当场投出局。如果好人阵营普遍认为让冒认身份的狼人被女巫毒死或者被猎人开枪打死也是可以接受的局面，那么新的“纳什均衡”就达成了。

本文系我群群友耿强原创，独家授权微信官方公众号青岛狼人杀权威发布，转载请注明出处。

狼人杀中的动态博弈

既然动态博弈是有先后顺序的，那么先行动者和后行动者哪个更具有优势呢？

后行动者的优势在于：后行动者可以观察到先行动者做出的选择，针对先行动者的选择可以评估形势并制定出当前形势下自己应采取的最优策略。

所谓的“高手”，就是可以在游戏开始之前，就制定好每一个决策点上的策略，即使这个决策点实际上不会出现。

定出下一个决策点的最优策略。能做到这一点，我们就有理由认为A是一位玩狼人的高手。

对于上述常见情景，我们来分析一下是如何达到现在这种“纳什均衡”的。一开始，我们是没有固定套路的，我们尝试了很多种不同的玩法，比如

本文系我群群友耿强原创，独家授权微信官方公众号青岛狼人杀权威发布，转载请注明出处。

狼人杀中的动态博弈

相关内容

热门内容

标签