第六章决策分析方法
第一节:管理决策概述
第二节:风险型决策分析
第三节:冲突分析
第一节管理决策概述
一、基本概念
决策是管理的重要职能,它是决策者对系统方案所做决定的过程和结果,决策是决策者的行为和职责。
按照H.A.西蒙(H.A.Simon)的观点,“管理就是决策”。因此,决策分析的一般过程也即管理系统分析的过程。
1 决策的含义与构成要素
决策:是决策者为达到某种预定目标,运用科学的理论、方法和手段,
制定出若干行动方案,对此做出一种具有判断性的选择,予以实施,直到目标实现。
2 决策的主体是管理者;决策的本质是一个过程,这一过程由多个步
骤组成;
3 决策的目的是解决问题和利用机会。
4. 评价决策有效性的标准
1.决策的质量和合理性。
2. 决策的可接受性。
3. 决策的时效性。
4. 决策的经济性
决策分析的类型
1.确定型决策:未来环境完全可以预测,人们知道将来会发生什么情况,可以获得精确、可靠的数据作为决策基础。
2.风险型决策:未来环境有几种可能的状态、相应后果,可以观测每种状态、后果出现的概率。
3.不确定型决策:未来环境出现某种状态的概率难以估计,甚至连可能出现的状态、相应的后果都不知道。
三、几类基本决策问题的分析
1.确定型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);(2)存在确定的自然状态;(3)存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法:一般计量方法;经济分析方法;运筹学方法
严格地来讲,确定型问题只是优化计算问题,而不属于真正的管理决策分析问题
2.风险型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);(2)存在两个以上不以决策者主观意志为转移的自然状态,但决策者或分析人员根据过去的经验和科学理论等可预先估算出自然状态的概率值P(θ);(3)存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法:期望值、决策树法。
风险型决策问题是一般决策分析的主要内容。在基本方法的基础上,应注意把握信息的价值及其分析和决策者的效用观等重要问题。
3.不确定型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);
(2)自然状态不确定,且其出现的概率不可知;存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法: (1)乐观法(最大最大原则)、(2)悲观法(最小最大原则)、 (3)均值法、 (4)后悔值法。
对于不确定型决策分析问题,若采用不同求解方法,则所得的结果也会有所不同,因为这些决策方法是各自从不同的决策准则出发来选择最优方案的。而具体采用何种方法,又视决策者的态度或效用观而定,在理论上还不能证明哪种方法是最为合适的。
4.对抗型决策
Wij=f(Ai,Bj) i=1,m , j= 1,n
其中:A——决策者的策略集;
B——竞争对手的策略集
可采用对策论及其冲突分析等方法来分析解决。这类决策分析问题是当前管理、经济界比较关注的问题。
5.多目标决策(AHP)
(三)决策方法
1 风险型决策方法
每个方案的益损期望值可表示为: ViVP(Siji
j1mj),
Vij-第Sj下的益损值; i方案在自然状态式中:Vi-第i方案的益损期望值;
Pj-自然状态Sj出现的概率。
(1)期望值法(决策表法): 分别计算出方案在不同自然状态下的益损期望值,并列成表,然后从中选择收益期望值最大或者损失期望值最小的方案作为最优方案。
(2)决策树法
结果点 结果点 结果点
结果点 决策的过程是从右向左逐步后退进行分析 。根据右端的益损值和
概率枝的概率,计算出期望值的大小,确定方案的期望结果,之后作出选择。
优点有三:形成了一个简单明晰的决策过程,使决策者能按顺序有步骤地进行决策;构成的决策图比较直观,便于集体讨论决策;便于随时查核重要的决策依据,并可适时进行修改、补充,以更好地实现预定目标。
描述多级决策(序列决策)的工具
“•”表示决 策节点,从它引出的分枝为方案枝,分枝数量与方案数量相同,分枝上要注明方案名称。
“O”表示状态节点,从它引出的分枝为状态分枝或概率分枝,分枝数量与可能出现的自然状态数量相同,分枝上要注明状态名称及其出现的概率。
“△ ”表示结果节点,不同方案在各种状态下所取得的结果(益损值),标注在结果节点的右端。
信息的价值
完全信息:即据此可以得到完全肯定的自然状态信息。
信息可靠,有助于正确决策,但获取该类信息代价大,且较难获得。 抽样信息:通过抽样所获得的信息,用统计方法来推断自然状态出现的概率,据此来选择行动方案。
信息不十分可靠,但获取该类信息代价较小,多数情况下,只可能获得该类信息,以供决策之需。
贝叶斯决策
在实际工作中,总希望通过调查、分析,以获得有一定可靠度的情报资料。对这类问题的决策分析,耍应用条件概率和贝叶斯定理,因此,也称为贝叶斯决策
定义 :事件组A1,A2,„,An (n可为),称为样本空间Ω的一个划分。
定理1.1(p17) 设A1,„, An是Ω 的一个划分,构成一个完备事件组,且P(Ai)>0,(i=1,„,n),
则对任何事件BΩ有
式(1.12)就称为全概率公式。
在较复杂情况下,直接计算P(B)不容易, 但总可以适当地构造一组两两互斥的Ai ,使B伴随着某个Ai的出现而出现,且每个 容易计算。可用所有 之和计算P(B)。
2 不确定型决策:
不但要在不确定的自然状态下进行决策,而且连每一种自然状态发生的概率也无法知道。
在这种条件下如何更好地去“碰运气”:
决策法则:1) 悲观法则-小中取大法则 max{min[V(Ai,Sj)]} AS
2) 乐观法则-大中取大法则 max{max[V(Ai,Sj)]} AS 3) 折衷法则-a法则 HiaVimax(1a)Vimin, maxHi作为最优方案
4) 大中取小法则-最小遗憾法则
5) 平均法则-均匀概率法则,又称合理法则,拉普拉斯法则。
1m
max{Mi}, MiV(Ai,Sj),(i1,2,,n) Anj1
条件:
①存在决策者希望达到的明确目标(收益大或损失小等);
②自然状态不确定,且其出现的概率不可知;
③存在着可供选择的两种以上的行动方案;
④不同行动方案在确定状态下的益损值可以计算出来
方法:悲观法;乐观法;
后悔值法; 等概率法
悲观法
从各方案的最小益损值中选择最大的,也称“小中取大”法,是一
种万无一失的保守型决策者的选择准则。
乐观法
决策者对客观情况总是抱乐观态度,从各方案最大益损值中选择最
大的,也称“大中取大”。是一种偏于冒进的决策准则
后悔值法
决策者一般易于接受某状态下收益最大的方案,但由于无法预知那
一状态一定出现,当决策者没有采纳收益最大的方案,就会感到后悔,最大收益值与其他收益值之差作为后悔值或机会损失值,然后按悲观主义准则决策。
等可能性准则
决策者不能肯定那种状态会出现,采取一视同仁的态度,认为出现
的可能性相等,有n个状态,其出现的概率均为1/n,计算各方案的期望最大收益值,从中选取最大的。
效用理论
需要一种能表达人们主观价值的衡量指标,并能综合衡量各种定量和定性的后果。
这样的指标没有统一的客观尺度,因人而异,视个人的经济、社会和心理条件而定。
通过效用函数及其效用曲线所确定的效用值就是一种有效的准则或尺度。
效用实质上反映了决策者对风险所抱的态度
效用:决策者对某种利益和损失所独有的感觉和反应
效用值:用效用概念衡量人们对同一期望值在主观上的价值
效用函数(曲线):决策者的期望值与效用值的对应关系
效用决策就是将后果用效用值代替,以期望效用最大为决策准则 效用值是决策者对得失效果的看法和态度的一种相对数量表示。用来衡量人们对某些事物的主观价值、态度、偏好、倾向;衡量人们对待风险的态度;并可以对难以量化的指标进行量化。
效用值U是对实际货币值的一种效用度量的标准,它是实际货币值的函数,并且因人而异。若用M表示实际的货币值,则效用值可以记为U(M)。
效用值是衡量人们对货币的主观认识即货币的主观价值的一种度量标准。同样货币在不同的风险场合,其价值在同一个人感觉不一样。同样货币,在不同的人来看,有不同的价值。
同实际的货币值不同,效用值大小是一个相对概念。如果决策者对同一决策问题可能出现的两种结局认为无差别,则认为两者的效用值相同。可以此为准则计算决策者对特定决策问题不同货币值的效用值。
效用值的标度
效用值原则上可以选任何标度,实用上常取[0~1]区间的值。即最小效用值U(MMin)=0,而最大效用值取U(MMax)=1,M为决策者的损益值。
在进行决策时,不同的决策者由于其经济地位、个人气质以及对风险的态度等的不同,对同样的期望益损值可能赋予不同的效用值。说明每人各有其自己的效用值计算标准,这种效用值的计算标准可以用函数进行表示。因此,定义表示效用值计算标准的函数称为效用值函数。若以益损值为横坐标,以效用值为纵坐标建立直角坐标系,在此描绘效用值函数的图形,称为效用曲线。
第三节 博弈论与冲突分析
一.博弈论(Game Theory)
1.博弈论的起源:Game
(1)博弈论译自英文:Game Theory,“Game”的本义就
是游戏(弈棋、赌胜)。
Game的共同特征:都有一定的规则;都有一个结果;参
与者都面临策略选择;策略至关重要,与参与者的利益相互
依存。
举例:寡头市场中厂商的产量决策;市场开发竞争中的
策略较量与策略依存性等等。
因博弈论而获得诺贝尔经济学奖的获奖者
1994年 --非合作博弈论
约翰·福布斯·纳什(John F. Nash Jr.)美国人
约翰·海萨尼(John C. Harsanyi)美国人
莱因哈德·泽尔腾(Reinhard Selten)德国人( 1930- ) 1996年 --信息经济学、博弈论
詹姆斯·莫里斯(James A. Mirrlees)英国人(1936- ) 威廉·维克瑞(William Vickrey)美国人 (1914-1996) 2001年 --信息经济学
乔治·阿克尔洛夫(George A. Akerlof )
迈克尔·斯宾塞(A. Michael Spence )
约瑟夫·斯蒂格利茨(Joseph E. Stiglitz)
2002年 -- 行为经济学和实验经济学
丹尼尔·卡纳曼(Daniel Kahneman)
弗农·史密斯(Vernon L. Smith)
2005年 --博弈论
托马斯·克罗姆比·谢林 (Thomas Crombie Schelling) 罗伯特·约翰·奥曼(Robert John Aumann)
2007年 --经济机制设计
埃里克·马斯金(Eric S. Maskin)
纳什均衡对经济学的重要影响
1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”
(二)博弈的定义
博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
博弈的四要素:参加者(Players);策略/行为
(Strateg-ies/Actions);次序(Orders);得益(Payoffs)。
三)几类经典的博弈模型
1.囚徒困境 “ 囚徒困境”博弈是由图克(Tucker)在1950年提出的经典模型,它很好地反映了博弈问题的根本特征,是解释众多经济现
象、研究经济效率问题的非常有效的基本模型和范式。 3.赌胜博弈 博弈本身就包含了“赌”和“胜”的意思,赌胜博弈属于“零和博弈”的范畴,也就是说,博弈方的收益互为消长。 (1)田忌赛马
(2)猜硬币 (3)石头剪子布
(四)博弈的分类
1.博弈方
单人博弈:单人迷宫、运输路线
两人博弈
多人博弈
单人博弈的最大特征是信息拥有量与得益正相关;两人
或多人博弈中,博弈双方不总是相互对抗,也有利益一致的
情形(合作博弈);多人博弈与两人博弈的本质区别就是存在
破坏者(策略选择不影响自身的利益,但会影响其他博弈方
的利益,如奥运会主办权的争夺)。
2.策略的数量
有限博弈:每一博弈方的可选策略都有限
无限博弈:至少一个博弈方具有无限的可选择策略
3.利益
零和博弈:博弈方始终对立(战争)
常和博弈:有对立也有妥协,和平共处(分配奖金)
变和博弈:社会总得益的角度(有效/低效/无效)
4.过程:静态博弈、动态博弈
静态博弈: 就是双方同时进行博弈或者可以看做同时选择策略的博弈成为静态博弈(static games)。
动态博弈:各博弈方的选择和行动不仅有先后顺序,而且后选择后行动的博弈方在自己选择行动之前,可以看到其他博弈方的行动选择,甚至还包括自己的行动选择。这种博弈无论如何都无法看做同时决策,所以叫做动态博弈 (dynamic games)。
冲突分析的基本概念
一般来说,两个或两个以上的组织间存在争论,这种情况称为冲突。 将冲突视为一类独立的问题,加以系统地研究,称为冲突分析。 冲突分析的目的在于协调冲突中各参与者之间的矛盾,提出最终权宜解决方案。这是一种着眼于解决现实社会争端的一种特别的游戏理论,属于一般博弈理论的一个分支。
冲突分析的一般过程或程序如下图所示:
四、F-H冲突分析基本概念和思想
Nash均衡点: Nash平衡点还可以这样来理解,当所有局中人都采用平衡点中的相应策略,任何一个局中人单方改变策略并不会使自己的支付提高。
Nash对策方法和F-H冲突分析方法的区别:
Nash对策(非合作对策)是一种策略分析方法,由于这种分析只考虑了对方对自己策略的反应,并未考虑冲突的最终结果的影响,因此,会导致悖论的出现。而F-H冲突分析方法是一种局势分析方法,它从分析局势的稳定性入手,对于冲突的一个局势,它考虑多个局中人中的一个通过离开目前方案是否达到更好的局势,同其他局中人合作而使合作者都受益的最后方案是否值得,冲突中的其他局中人将怎样面对该局中人的移动和反移动等。F-H冲突分析方法就是从这些方面来考查一个冲突的结果的。
F-H方法的主要概念
1.单方移动与单方改进:在其他局中人策略不变的情况下,仅某个局中人单方面改变自己的策略,而使冲突从一个可行局势转到另一个可行局势,这种转移便称为该局中人的单方移动。局中人通过单方移动而达到比目前局势更好的局势,这种单方移动便称为局中人的单方改进。
2.必然制裁:对某个局中人单方改进后的局势,其它局中人又拥有一个单方改进,使得经其它局中人进一步改进后的冲突局势对该局中人而言反不如其未做单方改进时的局势,我们便称为该局中人的这个单方改进存在一个必然制裁。
3.局势的合理性:对某局中人而言,对该局势不存在单方改进,则称该局势对这个局中人具有合理性。
4.相继稳定性:指对于该局势的每一个单方改进,局中人均存在必然制裁。
5.不稳定性:对某个局中人关于该局势的单方改进不存在必然制裁,则称该局势对这个局中人具有不稳定性。
6.同步稳定性:设局势q对m个局中人都具有不稳定性,则这m个局中人均试图进行各自的单方改进,设各自的单方改进后局势分别为ai,i=1,2,„,m。此时m个局中人共同改进,而使冲突的局势最终为p,对某个局中人而言,若对p的偏好低于q,则称q对该局中人具有同步稳定性。这时该局中人即不会对q进行其单方改进,从而最终亦无法形成局势
五、冲突分析的基本步骤
1.建模:研究冲突的本质结构,确定冲突所涉及的局中人
(Players),局中人的可选措施(Options)和策略(Strategies),由此确定冲突的可行局势(Feasible Outcome)并计算局中人的局势偏好向量(Preference Vector),进而确定各局中人局势的单方改进局势(Unilateral Improvement)。
2.稳定性分析:运用合理性(Rationality)、相继稳定性
(Sequential Stability)、同步稳定性(Simultaneous Stability)等判断准则分析各局中人的局势稳定性,进而寻找冲突的平衡点
(Equilibrium),在多于一个平衡点的情况下,对这些平衡点进行可行性分析,确定冲突的最可能解。
判断局势q是否为局中人i的稳定局势的步骤如下:
(1) 若q无任何单方改进局势,则q是i的合理局势,记作r。
(2) 记所有单方改进局势中局中人i认为最好的局势为p。
(3) 检验其他局中人对p有无必然制裁,若有,至第4步;若无,则q是不稳定局势,记作u。
(4) 记除p以外的单方改进中最好的局势为p,回到第3步。
(5) 若所有单方改进局势均遭制裁,则局势q是相继稳定局势,记作s。
(6) 对不稳定性局势检验其同步稳定性,若为同步稳定局势,则在原u上加一撇,即ú。
(7) 结束。
关注PPT上例题!!!
求其Nash平衡解,.的结果(-5,-5)。可见“囚犯难题”中追求最优目标的动机和实际达到低劣结果之间的矛盾便是该悖论的焦点。追求个人的“最优”策略往往导致全局的劣等解,从而又将损害个人的利益,这就是“囚犯悖论”的社会意义。
使用F-H方法求解囚徒问题
1.局中人:囚犯A、囚犯B
2.策略:
囚犯A 坦白 1;抗拒0
囚犯B 坦白 1;抗拒0
3.局势:(1,1),(1,0),(0,1),(0,0)
4.代码: 3 1 2 0
5.支付: (-5,-5)(0,-10)(-10,0)(-1,-1)
6.囚犯A局势排序:(1,0,3,2)
7.囚犯B局势排序:(2,0,3,1)
A 1 0 1 0 A 0 0 1 1
B 0 0 1 1 B 1 0 1 0
———— ————
1 0 3 2 ,A排序 2 0 3 1 ,B排序
8.稳定性分析
A r s r u
1 0 3 2 局势排序
1 3 单方改进局势
B r s r u
2 0 3 1 局势排序
2 3 单方改进局势
稳定局势:0(0,0);3(1,1)
第六章决策分析方法
第一节:管理决策概述
第二节:风险型决策分析
第三节:冲突分析
第一节管理决策概述
一、基本概念
决策是管理的重要职能,它是决策者对系统方案所做决定的过程和结果,决策是决策者的行为和职责。
按照H.A.西蒙(H.A.Simon)的观点,“管理就是决策”。因此,决策分析的一般过程也即管理系统分析的过程。
1 决策的含义与构成要素
决策:是决策者为达到某种预定目标,运用科学的理论、方法和手段,
制定出若干行动方案,对此做出一种具有判断性的选择,予以实施,直到目标实现。
2 决策的主体是管理者;决策的本质是一个过程,这一过程由多个步
骤组成;
3 决策的目的是解决问题和利用机会。
4. 评价决策有效性的标准
1.决策的质量和合理性。
2. 决策的可接受性。
3. 决策的时效性。
4. 决策的经济性
决策分析的类型
1.确定型决策:未来环境完全可以预测,人们知道将来会发生什么情况,可以获得精确、可靠的数据作为决策基础。
2.风险型决策:未来环境有几种可能的状态、相应后果,可以观测每种状态、后果出现的概率。
3.不确定型决策:未来环境出现某种状态的概率难以估计,甚至连可能出现的状态、相应的后果都不知道。
三、几类基本决策问题的分析
1.确定型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);(2)存在确定的自然状态;(3)存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法:一般计量方法;经济分析方法;运筹学方法
严格地来讲,确定型问题只是优化计算问题,而不属于真正的管理决策分析问题
2.风险型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);(2)存在两个以上不以决策者主观意志为转移的自然状态,但决策者或分析人员根据过去的经验和科学理论等可预先估算出自然状态的概率值P(θ);(3)存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法:期望值、决策树法。
风险型决策问题是一般决策分析的主要内容。在基本方法的基础上,应注意把握信息的价值及其分析和决策者的效用观等重要问题。
3.不确定型决策
条件:(1)存在决策者希望达到的明确目标(收益大或损失小等);
(2)自然状态不确定,且其出现的概率不可知;存在着可供选择的两个以上的行动方案;(4)不同行动方案在确定状态下的益损值可以计算出来。
方法: (1)乐观法(最大最大原则)、(2)悲观法(最小最大原则)、 (3)均值法、 (4)后悔值法。
对于不确定型决策分析问题,若采用不同求解方法,则所得的结果也会有所不同,因为这些决策方法是各自从不同的决策准则出发来选择最优方案的。而具体采用何种方法,又视决策者的态度或效用观而定,在理论上还不能证明哪种方法是最为合适的。
4.对抗型决策
Wij=f(Ai,Bj) i=1,m , j= 1,n
其中:A——决策者的策略集;
B——竞争对手的策略集
可采用对策论及其冲突分析等方法来分析解决。这类决策分析问题是当前管理、经济界比较关注的问题。
5.多目标决策(AHP)
(三)决策方法
1 风险型决策方法
每个方案的益损期望值可表示为: ViVP(Siji
j1mj),
Vij-第Sj下的益损值; i方案在自然状态式中:Vi-第i方案的益损期望值;
Pj-自然状态Sj出现的概率。
(1)期望值法(决策表法): 分别计算出方案在不同自然状态下的益损期望值,并列成表,然后从中选择收益期望值最大或者损失期望值最小的方案作为最优方案。
(2)决策树法
结果点 结果点 结果点
结果点 决策的过程是从右向左逐步后退进行分析 。根据右端的益损值和
概率枝的概率,计算出期望值的大小,确定方案的期望结果,之后作出选择。
优点有三:形成了一个简单明晰的决策过程,使决策者能按顺序有步骤地进行决策;构成的决策图比较直观,便于集体讨论决策;便于随时查核重要的决策依据,并可适时进行修改、补充,以更好地实现预定目标。
描述多级决策(序列决策)的工具
“•”表示决 策节点,从它引出的分枝为方案枝,分枝数量与方案数量相同,分枝上要注明方案名称。
“O”表示状态节点,从它引出的分枝为状态分枝或概率分枝,分枝数量与可能出现的自然状态数量相同,分枝上要注明状态名称及其出现的概率。
“△ ”表示结果节点,不同方案在各种状态下所取得的结果(益损值),标注在结果节点的右端。
信息的价值
完全信息:即据此可以得到完全肯定的自然状态信息。
信息可靠,有助于正确决策,但获取该类信息代价大,且较难获得。 抽样信息:通过抽样所获得的信息,用统计方法来推断自然状态出现的概率,据此来选择行动方案。
信息不十分可靠,但获取该类信息代价较小,多数情况下,只可能获得该类信息,以供决策之需。
贝叶斯决策
在实际工作中,总希望通过调查、分析,以获得有一定可靠度的情报资料。对这类问题的决策分析,耍应用条件概率和贝叶斯定理,因此,也称为贝叶斯决策
定义 :事件组A1,A2,„,An (n可为),称为样本空间Ω的一个划分。
定理1.1(p17) 设A1,„, An是Ω 的一个划分,构成一个完备事件组,且P(Ai)>0,(i=1,„,n),
则对任何事件BΩ有
式(1.12)就称为全概率公式。
在较复杂情况下,直接计算P(B)不容易, 但总可以适当地构造一组两两互斥的Ai ,使B伴随着某个Ai的出现而出现,且每个 容易计算。可用所有 之和计算P(B)。
2 不确定型决策:
不但要在不确定的自然状态下进行决策,而且连每一种自然状态发生的概率也无法知道。
在这种条件下如何更好地去“碰运气”:
决策法则:1) 悲观法则-小中取大法则 max{min[V(Ai,Sj)]} AS
2) 乐观法则-大中取大法则 max{max[V(Ai,Sj)]} AS 3) 折衷法则-a法则 HiaVimax(1a)Vimin, maxHi作为最优方案
4) 大中取小法则-最小遗憾法则
5) 平均法则-均匀概率法则,又称合理法则,拉普拉斯法则。
1m
max{Mi}, MiV(Ai,Sj),(i1,2,,n) Anj1
条件:
①存在决策者希望达到的明确目标(收益大或损失小等);
②自然状态不确定,且其出现的概率不可知;
③存在着可供选择的两种以上的行动方案;
④不同行动方案在确定状态下的益损值可以计算出来
方法:悲观法;乐观法;
后悔值法; 等概率法
悲观法
从各方案的最小益损值中选择最大的,也称“小中取大”法,是一
种万无一失的保守型决策者的选择准则。
乐观法
决策者对客观情况总是抱乐观态度,从各方案最大益损值中选择最
大的,也称“大中取大”。是一种偏于冒进的决策准则
后悔值法
决策者一般易于接受某状态下收益最大的方案,但由于无法预知那
一状态一定出现,当决策者没有采纳收益最大的方案,就会感到后悔,最大收益值与其他收益值之差作为后悔值或机会损失值,然后按悲观主义准则决策。
等可能性准则
决策者不能肯定那种状态会出现,采取一视同仁的态度,认为出现
的可能性相等,有n个状态,其出现的概率均为1/n,计算各方案的期望最大收益值,从中选取最大的。
效用理论
需要一种能表达人们主观价值的衡量指标,并能综合衡量各种定量和定性的后果。
这样的指标没有统一的客观尺度,因人而异,视个人的经济、社会和心理条件而定。
通过效用函数及其效用曲线所确定的效用值就是一种有效的准则或尺度。
效用实质上反映了决策者对风险所抱的态度
效用:决策者对某种利益和损失所独有的感觉和反应
效用值:用效用概念衡量人们对同一期望值在主观上的价值
效用函数(曲线):决策者的期望值与效用值的对应关系
效用决策就是将后果用效用值代替,以期望效用最大为决策准则 效用值是决策者对得失效果的看法和态度的一种相对数量表示。用来衡量人们对某些事物的主观价值、态度、偏好、倾向;衡量人们对待风险的态度;并可以对难以量化的指标进行量化。
效用值U是对实际货币值的一种效用度量的标准,它是实际货币值的函数,并且因人而异。若用M表示实际的货币值,则效用值可以记为U(M)。
效用值是衡量人们对货币的主观认识即货币的主观价值的一种度量标准。同样货币在不同的风险场合,其价值在同一个人感觉不一样。同样货币,在不同的人来看,有不同的价值。
同实际的货币值不同,效用值大小是一个相对概念。如果决策者对同一决策问题可能出现的两种结局认为无差别,则认为两者的效用值相同。可以此为准则计算决策者对特定决策问题不同货币值的效用值。
效用值的标度
效用值原则上可以选任何标度,实用上常取[0~1]区间的值。即最小效用值U(MMin)=0,而最大效用值取U(MMax)=1,M为决策者的损益值。
在进行决策时,不同的决策者由于其经济地位、个人气质以及对风险的态度等的不同,对同样的期望益损值可能赋予不同的效用值。说明每人各有其自己的效用值计算标准,这种效用值的计算标准可以用函数进行表示。因此,定义表示效用值计算标准的函数称为效用值函数。若以益损值为横坐标,以效用值为纵坐标建立直角坐标系,在此描绘效用值函数的图形,称为效用曲线。
第三节 博弈论与冲突分析
一.博弈论(Game Theory)
1.博弈论的起源:Game
(1)博弈论译自英文:Game Theory,“Game”的本义就
是游戏(弈棋、赌胜)。
Game的共同特征:都有一定的规则;都有一个结果;参
与者都面临策略选择;策略至关重要,与参与者的利益相互
依存。
举例:寡头市场中厂商的产量决策;市场开发竞争中的
策略较量与策略依存性等等。
因博弈论而获得诺贝尔经济学奖的获奖者
1994年 --非合作博弈论
约翰·福布斯·纳什(John F. Nash Jr.)美国人
约翰·海萨尼(John C. Harsanyi)美国人
莱因哈德·泽尔腾(Reinhard Selten)德国人( 1930- ) 1996年 --信息经济学、博弈论
詹姆斯·莫里斯(James A. Mirrlees)英国人(1936- ) 威廉·维克瑞(William Vickrey)美国人 (1914-1996) 2001年 --信息经济学
乔治·阿克尔洛夫(George A. Akerlof )
迈克尔·斯宾塞(A. Michael Spence )
约瑟夫·斯蒂格利茨(Joseph E. Stiglitz)
2002年 -- 行为经济学和实验经济学
丹尼尔·卡纳曼(Daniel Kahneman)
弗农·史密斯(Vernon L. Smith)
2005年 --博弈论
托马斯·克罗姆比·谢林 (Thomas Crombie Schelling) 罗伯特·约翰·奥曼(Robert John Aumann)
2007年 --经济机制设计
埃里克·马斯金(Eric S. Maskin)
纳什均衡对经济学的重要影响
1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”
(二)博弈的定义
博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
博弈的四要素:参加者(Players);策略/行为
(Strateg-ies/Actions);次序(Orders);得益(Payoffs)。
三)几类经典的博弈模型
1.囚徒困境 “ 囚徒困境”博弈是由图克(Tucker)在1950年提出的经典模型,它很好地反映了博弈问题的根本特征,是解释众多经济现
象、研究经济效率问题的非常有效的基本模型和范式。 3.赌胜博弈 博弈本身就包含了“赌”和“胜”的意思,赌胜博弈属于“零和博弈”的范畴,也就是说,博弈方的收益互为消长。 (1)田忌赛马
(2)猜硬币 (3)石头剪子布
(四)博弈的分类
1.博弈方
单人博弈:单人迷宫、运输路线
两人博弈
多人博弈
单人博弈的最大特征是信息拥有量与得益正相关;两人
或多人博弈中,博弈双方不总是相互对抗,也有利益一致的
情形(合作博弈);多人博弈与两人博弈的本质区别就是存在
破坏者(策略选择不影响自身的利益,但会影响其他博弈方
的利益,如奥运会主办权的争夺)。
2.策略的数量
有限博弈:每一博弈方的可选策略都有限
无限博弈:至少一个博弈方具有无限的可选择策略
3.利益
零和博弈:博弈方始终对立(战争)
常和博弈:有对立也有妥协,和平共处(分配奖金)
变和博弈:社会总得益的角度(有效/低效/无效)
4.过程:静态博弈、动态博弈
静态博弈: 就是双方同时进行博弈或者可以看做同时选择策略的博弈成为静态博弈(static games)。
动态博弈:各博弈方的选择和行动不仅有先后顺序,而且后选择后行动的博弈方在自己选择行动之前,可以看到其他博弈方的行动选择,甚至还包括自己的行动选择。这种博弈无论如何都无法看做同时决策,所以叫做动态博弈 (dynamic games)。
冲突分析的基本概念
一般来说,两个或两个以上的组织间存在争论,这种情况称为冲突。 将冲突视为一类独立的问题,加以系统地研究,称为冲突分析。 冲突分析的目的在于协调冲突中各参与者之间的矛盾,提出最终权宜解决方案。这是一种着眼于解决现实社会争端的一种特别的游戏理论,属于一般博弈理论的一个分支。
冲突分析的一般过程或程序如下图所示:
四、F-H冲突分析基本概念和思想
Nash均衡点: Nash平衡点还可以这样来理解,当所有局中人都采用平衡点中的相应策略,任何一个局中人单方改变策略并不会使自己的支付提高。
Nash对策方法和F-H冲突分析方法的区别:
Nash对策(非合作对策)是一种策略分析方法,由于这种分析只考虑了对方对自己策略的反应,并未考虑冲突的最终结果的影响,因此,会导致悖论的出现。而F-H冲突分析方法是一种局势分析方法,它从分析局势的稳定性入手,对于冲突的一个局势,它考虑多个局中人中的一个通过离开目前方案是否达到更好的局势,同其他局中人合作而使合作者都受益的最后方案是否值得,冲突中的其他局中人将怎样面对该局中人的移动和反移动等。F-H冲突分析方法就是从这些方面来考查一个冲突的结果的。
F-H方法的主要概念
1.单方移动与单方改进:在其他局中人策略不变的情况下,仅某个局中人单方面改变自己的策略,而使冲突从一个可行局势转到另一个可行局势,这种转移便称为该局中人的单方移动。局中人通过单方移动而达到比目前局势更好的局势,这种单方移动便称为局中人的单方改进。
2.必然制裁:对某个局中人单方改进后的局势,其它局中人又拥有一个单方改进,使得经其它局中人进一步改进后的冲突局势对该局中人而言反不如其未做单方改进时的局势,我们便称为该局中人的这个单方改进存在一个必然制裁。
3.局势的合理性:对某局中人而言,对该局势不存在单方改进,则称该局势对这个局中人具有合理性。
4.相继稳定性:指对于该局势的每一个单方改进,局中人均存在必然制裁。
5.不稳定性:对某个局中人关于该局势的单方改进不存在必然制裁,则称该局势对这个局中人具有不稳定性。
6.同步稳定性:设局势q对m个局中人都具有不稳定性,则这m个局中人均试图进行各自的单方改进,设各自的单方改进后局势分别为ai,i=1,2,„,m。此时m个局中人共同改进,而使冲突的局势最终为p,对某个局中人而言,若对p的偏好低于q,则称q对该局中人具有同步稳定性。这时该局中人即不会对q进行其单方改进,从而最终亦无法形成局势
五、冲突分析的基本步骤
1.建模:研究冲突的本质结构,确定冲突所涉及的局中人
(Players),局中人的可选措施(Options)和策略(Strategies),由此确定冲突的可行局势(Feasible Outcome)并计算局中人的局势偏好向量(Preference Vector),进而确定各局中人局势的单方改进局势(Unilateral Improvement)。
2.稳定性分析:运用合理性(Rationality)、相继稳定性
(Sequential Stability)、同步稳定性(Simultaneous Stability)等判断准则分析各局中人的局势稳定性,进而寻找冲突的平衡点
(Equilibrium),在多于一个平衡点的情况下,对这些平衡点进行可行性分析,确定冲突的最可能解。
判断局势q是否为局中人i的稳定局势的步骤如下:
(1) 若q无任何单方改进局势,则q是i的合理局势,记作r。
(2) 记所有单方改进局势中局中人i认为最好的局势为p。
(3) 检验其他局中人对p有无必然制裁,若有,至第4步;若无,则q是不稳定局势,记作u。
(4) 记除p以外的单方改进中最好的局势为p,回到第3步。
(5) 若所有单方改进局势均遭制裁,则局势q是相继稳定局势,记作s。
(6) 对不稳定性局势检验其同步稳定性,若为同步稳定局势,则在原u上加一撇,即ú。
(7) 结束。
关注PPT上例题!!!
求其Nash平衡解,.的结果(-5,-5)。可见“囚犯难题”中追求最优目标的动机和实际达到低劣结果之间的矛盾便是该悖论的焦点。追求个人的“最优”策略往往导致全局的劣等解,从而又将损害个人的利益,这就是“囚犯悖论”的社会意义。
使用F-H方法求解囚徒问题
1.局中人:囚犯A、囚犯B
2.策略:
囚犯A 坦白 1;抗拒0
囚犯B 坦白 1;抗拒0
3.局势:(1,1),(1,0),(0,1),(0,0)
4.代码: 3 1 2 0
5.支付: (-5,-5)(0,-10)(-10,0)(-1,-1)
6.囚犯A局势排序:(1,0,3,2)
7.囚犯B局势排序:(2,0,3,1)
A 1 0 1 0 A 0 0 1 1
B 0 0 1 1 B 1 0 1 0
———— ————
1 0 3 2 ,A排序 2 0 3 1 ,B排序
8.稳定性分析
A r s r u
1 0 3 2 局势排序
1 3 单方改进局势
B r s r u
2 0 3 1 局势排序
2 3 单方改进局势
稳定局势:0(0,0);3(1,1)