博弈论读后感

博弈论读后感

本学期我通过为期八周的课堂学习已经私下通过阅读中国人民大学出版的王则柯、李杰编著的《博弈论教程》一书，收获颇多。此书一共分为九章，通过自己对整本书的阅读以及结合老师上课的详细解说，可以认为博弈大致有以下两种分类：按照博弈各方是否同时决策可以分为：同时决策博弈（静态博弈）、序贯决策博弈（动态博弈）、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为：完全信息博弈和不完全信息博弈。自由组合一下啊，就会发现博弈的四大部分：完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。

一、同时决策博弈

1、纳什均衡的定义：在博弈G=﹛S1,…,Sn：u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…，sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui（s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡。优势策略有严格优势策略和弱优势策略之分，可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。

2、混合策略纳什均衡

对于有时候纳什均衡不是唯一的，有时候纳什均衡是不存在的，按照上述方法寻找博弈的结果有时候不能实现，所以需要展开纳什均衡。

混合策略与纯策略的区别在于，混合策略是局中人可以按照一定的概率，随机的从策略组合中选择一种纯策略作为实际的行动。

混合策略：有一个有N个局中人参与的策略式博弈中，假定局中人有个纯策略，即概率分布，其中称为局中人的一个混合策略，这里表示局中人选择纯策略的概率。

混合策略纳什均衡：在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}

**中，混合策略组合p*(p1*,p2,......pn)构成一个纳什均衡，如果对于所有

的i＝1，2...，n下式成立：

利用反应函数法和直线交叉法，寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时，需要用帕累托优势标准或者风险优势标准来筛选。

帕累托效率标准：经济的效率体现在配置社会资源以及改善人们的情况，主要看资源是否被充分利用，要想再改善某个人的利益，就必须损害其他局中人的利益，这时候就说一个经济已经实现了帕累托效率，相反，如果还可以在不损害别人的情况下改善任何人，就认为经济资源尚未被充分利用，就不能说经济已达到帕累托最优。

二、序贯决策博弈

序贯决策博弈的一个重要特征是总有一个局中人率先采取行动，因此

衍生出先动优势和后动优势。先动优势：虽然双方都得到好处，但是先决策先行动的一方得益多一些（比如情侣博弈）。后动优势：虽然双方都得到好处，但是后决策后行动的一方得益多一些（比如分蛋糕、产品定价）。在这一节中，要准确把握了“先动优势”和“后动优势”的概念，摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。

利用倒推法寻找序贯决策博弈的纳什均衡。

三、重复博弈和策略性行动

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

在表1描述的博弈模型中，每一次微观主体间的博弈均可看作一个子博弈。子博弈精炼纳什均衡包含两层含义:

（1）它是原博弈的纳什均衡；

（2）它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的，而在其他情况下并不合理的行动规则。

表１微观主体间的博弈

对于无限次重复的囚徒困境博弈，存在触发策略，两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略：指双方一开始的时候选择合作，然后继续选择合作，直到有一方选择背叛，从此永远选择背叛，这个策略之所以冷酷，是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略：开始的时候和冷酷策略一样，即双方都选择合作，在以后的每个阶段，如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略，则你继续合作，如果你的对手在上一个阶段的博弈中采取背叛策略，则你在下一阶段博弈中采取背叛策略报复，或者在以后k次策略中选择背叛进行报复。对手是否采取背叛策略，取决于有效收益率。

四、零和博弈

零和博弈又称“零和游戏”，与非零和博弈相对，属非合作博弈，指参与博弈的各方，在严格竞争下，一方的收益必然意味着另一方的损失，博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。

寻求二人零和博弈的纯策略纳什均衡，可以采用相对优势策略划线

法，也可以采用最小最大法，最小最大法依托的思想是：局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度，行局中人采用maximin的决策原则，列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。

五、个人的感受

博弈论原本为游戏理论，这一理论涉及的„游戏‟范围更广：人际关系的互动、球赛或麻将的出招、股市的投资等等，都可以用博弈论巧妙地解释，可以说，红尘人世，莫不博弈。”这就是《每天读点博弈论》中句子，说明了在人的一生中处处存在着博弈，只看你是如何去做罢了。

在整本书中，我感触最深的就是“信息博弈，比的就是信息”。信息在现今的社会中，是非常重要的，每天从睁开眼睛开始，就开始接触信息，小到每天的对话，大到报纸新闻，近到邻里之间，远至古今中外，信息无处不在。那我们在这些信息中如何捕获自己所需的信息？如何使自己获得最大的利益？

俗语说：车到山前必有路，船到桥头自然直。我以前理解成，无论多少难做的事情，到最后总会有办法的，可是却从没想过，为什么最后总会有办法解决呢？这本书中写到：收集信息不仅是解决问题的一个步骤，而且有时起到极为关键的作用。比如，当各种方法都尝试过，当问题成了一团乱麻，一切都僵住了。这时，最好的办法是再问问自己，原来收集的信息够全面吗？有没有漏掉的信息？解决之道，很可能就藏在被你忽略的信息中。从这个信息中，我明白了，不是事

情到最后总会有办法，而是当人们面临最大的困难时，会收集所有的信息，再从中一一击破，选中解决事情的最终办法。那为什么到最后一步才有办法了呢？其实我们可以从这句话中理解到，原来当我们有多种选择的时候，只从最有可能有结果的信息着手，往往忽视了自己身边最有利的一些小信息，而从堵死了自己的每一条路，正所谓，一着不慎，满盘皆输，这就是，我们从信息中，没有找到最有用的信息，导致了自己一败涂地，从中看到了信息的重要性。从而也说明了，千万不要轻视信息，以为信息已经足够用了，适量的信息意味着你的思路会被拓展得更宽。

我们学会了，如何注意身边的一些小信息，如何收集信息，但还要学会利用信息。在书中提到：任何时候，都不要只做被动接受信息的那个人，要学会主动利用信息。在现实生活中，我们都有体会，即使掌握了信息，如果不会运用，那信息对我们来说也是没有多大的用处。我们如何利用信息呢？我认为，当我们得到信息时，而不是本身的获得，而我们要重新开始认识信息，把所获得的信息认真分析，认真思考，让其发挥出最大的效用，只有这样，我们才不会让有用的信息白白的流失。当今社会处，信息无处不在，我们每一个人也离不开信息，那我们把信息运用到自己的生活中，那就是信息的博弈，正所谓：信息博弈，比的就是信息。

博弈论读后感

一、同时决策博弈

2、混合策略纳什均衡

对于有时候纳什均衡不是唯一的，有时候纳什均衡是不存在的，按照上述方法寻找博弈的结果有时候不能实现，所以需要展开纳什均衡。

混合策略与纯策略的区别在于，混合策略是局中人可以按照一定的概率，随机的从策略组合中选择一种纯策略作为实际的行动。

混合策略纳什均衡：在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}

**中，混合策略组合p*(p1*,p2,......pn)构成一个纳什均衡，如果对于所有

的i＝1，2...，n下式成立：

二、序贯决策博弈

序贯决策博弈的一个重要特征是总有一个局中人率先采取行动，因此

利用倒推法寻找序贯决策博弈的纳什均衡。

三、重复博弈和策略性行动

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

在表1描述的博弈模型中，每一次微观主体间的博弈均可看作一个子博弈。子博弈精炼纳什均衡包含两层含义:

（1）它是原博弈的纳什均衡；

（2）它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的，而在其他情况下并不合理的行动规则。

表１微观主体间的博弈

四、零和博弈

寻求二人零和博弈的纯策略纳什均衡，可以采用相对优势策略划线

五、个人的感受

相关内容

热门内容

标签