博弈论读后感

博弈论读后感

本学期我通过为期八周的课堂学习已经私下通过阅读中国人民大学出版的王则柯、李杰编著的《博弈论教程》一书,收获颇多。此书一共分为九章,通过自己对整本书的阅读以及结合老师上课的详细解说,可以认为博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。

一、同时决策博弈

1、纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。

2、混合策略纳什均衡

对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。

混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。

混合策略:有一个有N个局中人参与的策略式博弈中,假定局中人有个纯策略,即概率分布,其中称为局中人的一个混合策略,这里表示局中人选择纯策略的概率。

混合策略纳什均衡:在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}

**中,混合策略组合p*(p1*,p2,......pn)构成一个纳什均衡,如果对于所有

的i=1,2...,n下式成立:

利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。

帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。

二、序贯决策博弈

序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此

衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了“先动优势”和“后动优势”的概念,摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。

利用倒推法寻找序贯决策博弈的纳什均衡。

三、重复博弈和策略性行动

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

在表1描述的博弈模型中,每一次微观主体间的博弈均可看作一个子博弈。子博弈精炼纳什均衡包含两层含义:

(1)它是原博弈的纳什均衡;

(2)它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则。

表1 微观主体间的博弈

对于无限次重复的囚徒困境博弈,存在触发策略,两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。对手是否采取背叛策略,取决于有效收益率 。

四、零和博弈

零和博弈又称“零和游戏”,与非零和博弈相对,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。

寻求二人零和博弈的纯策略纳什均衡,可以采用相对优势策略划线

法,也可以采用最小最大法,最小最大法依托的思想是:局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度,行局中人采用maximin的决策原则,列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。

五、个人的感受

博弈论原本为游戏理论,这一理论涉及的„游戏‟范围更广:人际关系的互动、球赛或麻将的出招、股市的投资等等,都可以用博弈论巧妙地解释,可以说,红尘人世,莫不博弈。”这就是《每天读点博弈论》中句子,说明了在人的一生中处处存在着博弈,只看你是如何去做罢了。

在整本书中,我感触最深的就是“信息博弈,比的就是信息”。信息在现今的社会中,是非常重要的,每天从睁开眼睛开始,就开始接触信息,小到每天的对话,大到报纸新闻,近到邻里之间,远至古今中外,信息无处不在。那我们在这些信息中如何捕获自己所需的信息?如何使自己获得最大的利益?

俗语说:车到山前必有路,船到桥头自然直。我以前理解成,无论多少难做的事情,到最后总会有办法的,可是却从没想过,为什么最后总会有办法解决呢?这本书中写到:收集信息不仅是解决问题的一个步骤,而且有时起到极为关键的作用。比如,当各种方法都尝试过,当问题成了一团乱麻,一切都僵住了。这时,最好的办法是再问问自己,原来收集的信息够全面吗?有没有漏掉的信息?解决之道,很可能就藏在被你忽略的信息中。从这个信息中,我明白了,不是事

情到最后总会有办法,而是当人们面临最大的困难时,会收集所有的信息,再从中一一击破,选中解决事情的最终办法。那为什么到最后一步才有办法了呢?其实我们可以从这句话中理解到,原来当我们有多种选择的时候,只从最有可能有结果的信息着手,往往忽视了自己身边最有利的一些小信息,而从堵死了自己的每一条路,正所谓,一着不慎,满盘皆输,这就是,我们从信息中,没有找到最有用的信息,导致了自己一败涂地,从中看到了信息的重要性。从而也说明了,千万不要轻视信息,以为信息已经足够用了,适量的信息意味着你的思路会被拓展得更宽。

我们学会了,如何注意身边的一些小信息,如何收集信息,但还要学会利用信息。在书中提到:任何时候,都不要只做被动接受信息的那个人,要学会主动利用信息。在现实生活中,我们都有体会,即使掌握了信息,如果不会运用,那信息对我们来说也是没有多大的用处。我们如何利用信息呢?我认为,当我们得到信息时,而不是本身的获得,而我们要重新开始认识信息,把所获得的信息认真分析,认真思考,让其发挥出最大的效用,只有这样,我们才不会让有用的信息白白的流失。当今社会处,信息无处不在,我们每一个人也离不开信息,那我们把信息运用到自己的生活中,那就是信息的博弈,正所谓:信息博弈,比的就是信息。

博弈论读后感

本学期我通过为期八周的课堂学习已经私下通过阅读中国人民大学出版的王则柯、李杰编著的《博弈论教程》一书,收获颇多。此书一共分为九章,通过自己对整本书的阅读以及结合老师上课的详细解说,可以认为博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。

一、同时决策博弈

1、纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。

2、混合策略纳什均衡

对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。

混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。

混合策略:有一个有N个局中人参与的策略式博弈中,假定局中人有个纯策略,即概率分布,其中称为局中人的一个混合策略,这里表示局中人选择纯策略的概率。

混合策略纳什均衡:在n个参与人的博弈G={S1 ,... Sn ; u1 ,...un}

**中,混合策略组合p*(p1*,p2,......pn)构成一个纳什均衡,如果对于所有

的i=1,2...,n下式成立:

利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。

帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。

二、序贯决策博弈

序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此

衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了“先动优势”和“后动优势”的概念,摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。

利用倒推法寻找序贯决策博弈的纳什均衡。

三、重复博弈和策略性行动

子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

在表1描述的博弈模型中,每一次微观主体间的博弈均可看作一个子博弈。子博弈精炼纳什均衡包含两层含义:

(1)它是原博弈的纳什均衡;

(2)它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则。

表1 微观主体间的博弈

对于无限次重复的囚徒困境博弈,存在触发策略,两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。对手是否采取背叛策略,取决于有效收益率 。

四、零和博弈

零和博弈又称“零和游戏”,与非零和博弈相对,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。

寻求二人零和博弈的纯策略纳什均衡,可以采用相对优势策略划线

法,也可以采用最小最大法,最小最大法依托的思想是:局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度,行局中人采用maximin的决策原则,列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。

五、个人的感受

博弈论原本为游戏理论,这一理论涉及的„游戏‟范围更广:人际关系的互动、球赛或麻将的出招、股市的投资等等,都可以用博弈论巧妙地解释,可以说,红尘人世,莫不博弈。”这就是《每天读点博弈论》中句子,说明了在人的一生中处处存在着博弈,只看你是如何去做罢了。

在整本书中,我感触最深的就是“信息博弈,比的就是信息”。信息在现今的社会中,是非常重要的,每天从睁开眼睛开始,就开始接触信息,小到每天的对话,大到报纸新闻,近到邻里之间,远至古今中外,信息无处不在。那我们在这些信息中如何捕获自己所需的信息?如何使自己获得最大的利益?

俗语说:车到山前必有路,船到桥头自然直。我以前理解成,无论多少难做的事情,到最后总会有办法的,可是却从没想过,为什么最后总会有办法解决呢?这本书中写到:收集信息不仅是解决问题的一个步骤,而且有时起到极为关键的作用。比如,当各种方法都尝试过,当问题成了一团乱麻,一切都僵住了。这时,最好的办法是再问问自己,原来收集的信息够全面吗?有没有漏掉的信息?解决之道,很可能就藏在被你忽略的信息中。从这个信息中,我明白了,不是事

情到最后总会有办法,而是当人们面临最大的困难时,会收集所有的信息,再从中一一击破,选中解决事情的最终办法。那为什么到最后一步才有办法了呢?其实我们可以从这句话中理解到,原来当我们有多种选择的时候,只从最有可能有结果的信息着手,往往忽视了自己身边最有利的一些小信息,而从堵死了自己的每一条路,正所谓,一着不慎,满盘皆输,这就是,我们从信息中,没有找到最有用的信息,导致了自己一败涂地,从中看到了信息的重要性。从而也说明了,千万不要轻视信息,以为信息已经足够用了,适量的信息意味着你的思路会被拓展得更宽。

我们学会了,如何注意身边的一些小信息,如何收集信息,但还要学会利用信息。在书中提到:任何时候,都不要只做被动接受信息的那个人,要学会主动利用信息。在现实生活中,我们都有体会,即使掌握了信息,如果不会运用,那信息对我们来说也是没有多大的用处。我们如何利用信息呢?我认为,当我们得到信息时,而不是本身的获得,而我们要重新开始认识信息,把所获得的信息认真分析,认真思考,让其发挥出最大的效用,只有这样,我们才不会让有用的信息白白的流失。当今社会处,信息无处不在,我们每一个人也离不开信息,那我们把信息运用到自己的生活中,那就是信息的博弈,正所谓:信息博弈,比的就是信息。


相关内容

  • 英语作文电影读后感-美丽心灵
  • <美丽心灵>观后感真奇怪小时候最烦语文课留下的作业是看一部电影写观后感或者到什么地方参观后写观后感.那时候没什么感受,也许有但不记得了.写观后感是因为我掉眼泪了,被自己感动.我看过很多给我震撼的电影,但掉眼泪的不多,还能记起的两部,一部是<泰坦尼克>,一部是<教父> ...

  • 博弈读书笔记
  • <博弈:关于策略的63个有趣话题>读后感 这本书主要叙述的是生活艺术的表现需要把握细节细节虽小,却构成了生活的全部关注细节就是关注生活讲究细节就是讲究生活的质量和品位生活中总是有无数的烦恼困扰着你吗?你的他好像不如过去那样爱你了:工作了几年,升职却老也轮不到你:打拼这么久,小金库依然不见 ...

  • [南海问题背后的中美博弈]观后感
  • <南海问题背后的中美博弈>观后感 班级:*******班 姓名:****** 学号:********* 通过观看<南海问题背后的中美博弈>,我深入了解到杨毅将军的演讲内容和精华.主要阐述了南海问题的现状,分析了美国对南海问题的态度,提出了解决南海问题的途径.指出既要维护中国在 ...

  • [美丽心灵]观后感
  • <美丽心灵>观后感 昨晚我观看了同学介绍的一部心理电影<美丽心灵>,感慨万千! <美丽心灵>是一部根据真实人物改编而获得奥斯卡金像奖的电影.影片的主人公约翰-纳什是一位患有精神分裂症但却在博弈论和微分几何学领域潜心研究最终获得诺贝尔经济学奖的数学家.他在早年就做出 ...

  • 读后感之理解公共政策
  • 读<理解公共政策>有感 <理解公共政策>([美]托马斯·R.戴伊 著)一书共有14章,大致可分为三个部分:第一部分主要是对一些基本概念和知识的阐述,包括公共政策到底是什么.为什么要研究它.政策分析有何特点.分析的目标是什么等概念.第二部分主要是介绍政治学领域中受到广泛应用的八 ...

  • [自私的基因]读后感
  • <自私的基因>读后感 学号:11170406 姓名:黄丛威 大家都很熟悉达尔文的进化论:"物竞天择,适者生存".我们之前认为"物竞"指的是物种之间的竞争,"适者"指的是适合的物种或个体.<自私的基因>提出一个非常独特 ...

  • 无间道观后感
  • 无间道:无间地狱中的博弈与挣扎 第一次看<无间道>,大概是在2003年,它刚上映没多久的时候,也是我还看不懂这部电影的时候.转眼间十年多的时间已经过去,很多的情节已经忘记,唯一印象深刻的,就是接近尾声的时候,两个主人公在天台上对峙的一幕. 时隔十几年,重温这部电影,在能更深刻地去理解这部 ...

  • 自私的基因读后感
  • <自私的基因>读后感看自私的基因,多少也算是简单通俗的小册子一本.讲的是自私行为和利他 行为在生物学上的意义. 基因和进化论放在一起,完全可以诠释生命的来龙去脉.这是一个大体上自洽的 体系,虽然很多细节还可以不断完善.Dawkins 其实说,只要是碰巧的一些分子 组合有自我复制能力,就可 ...

  • "智猪博弈"的故事
  • 博弈论里面有个十分卡通化的博弈模型,叫做"智猪博弈"(Pig's payoffs). 整个故事是这样的:猪圈里有两头猪,一头大猪,一头小猪.猪圈很长,一头有个踏板,另一头是饲料的出口和食槽.每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物.如果有一只猪去踩踏板,另 ...