决策论与应用决策论分析问题
1. 决策论的简要介绍:
决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。在实际生活与生产中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。决策论是在概率论的基础上发展起来的。随着概率论的发展,早在1763年贝叶斯决策论相关书籍斯发表条件概率定理时起,统计判定理论就已发萌芽。1815年拉普拉斯用此定理估计第二天太阳还将升起的概率,把统计判定理论推向一个新阶段。统计判定理论实际上是在风险情况下的决策理论。这些理论和对策理论概念上的结合发展成为现代的决策论。决策论在包括安全生产在内的许多领域都有着重要应用。
决策是人类社会的一项重要活动, 它关系到人类生活的各个方面,是为达到某种目的而从若干问题求解方案中选出一个最优或合理方案的过程。
因此,决策是人们在各项工作中的一种重要选择行为。无论是行动方案的确定,还是重大发展战略的制定;是一个领导干部的选拔,还是一种产品的研制生产;是一个企业的生产管理,还是一个国家或地区的产业政策,都是有一系列决策活动来完成的。所以决策的正确与否是关系到事业的成败和利益的得失的大事。决策正确带来的是“一本万利”,而决策失误也是“最大的失误”。关于这一点,著名科学家﹑诺贝尔奖获得者H.A. 西蒙有句名言:“管理就是决策”,决策贯穿于管理的全过程。这也就是说,一切管理工作的核心就是决策。
在系统工程的工作过程中,有系统开发得到的若干解决问题的方案,经过系统建模﹑系统分析及系统评价等步骤,最终必须从备选方案中为决策者选出最佳的开发方案。这一程序是系统工程辩证程序中最后一个,也是最重要的一个,这就是系统决策。
H.A. 西蒙把决策过程同现代的管理学科﹑计算机技术和自动化技术结合起来,将其划分为四个重要阶段:找出制定决策的理由;找到可能的行动方案;在诸行动方案中进行抉择;对已进行的抉择进行评价。尽管不同的决策者在不同的决策场合对上述4个阶段的看法不一样,但这四个部分加在一起却构成了决策者所要做的主要工作。
以上四个阶段交织在一起,就形成了决策的过程。第一阶段是调查环境,寻求决策的条件和依据,即“情报阶段”;第二个阶段是创造﹑制定和分析可能采取行动的行动方案,即“设计阶段”;第三阶段是从可子利用的备选方案中选出一个行动方案,即“抉择阶段”;第四阶段是决策的事实与评价,西蒙称其为“审查活动”,其实是对过去的抉择进行评价。
现代计算机技术﹑管理科学等的发展,给决策制定的过程赋予了新的内容和含义。在情报和设计阶段,主要是依靠于可靠﹑准确﹑及时的基本信息,因此管理信息系统(management information system , MIS )就成为当代决策的重要技术基础;而在决择和评价阶段的主要技术措施就是模型方法,主要是指管理科学、
运筹学、系统工程中模型方法(MS/OR/SE)。将上述两部分技术集成在一起,利用先进的计算机软硬件技术,实现上述决策过程,开发成有好的人机系统,这就是决策支持系统(decision support system, DSS )。
2. 决策问题的分类与分析方法:
决策问题根据不同性质通常可以分为确定型、风险型(又称统计型或随机型)
和不确定型三种。
2.1确定型决策的分析:
是研究环境条件为确定情况下的决策。如某工厂每种产品的销售量已知,研
究生产哪几种产品获利最大,它的结果是确定的。确定型决策问题通常存在着一个确定的自然状态和决策者希望达到的一个确定目标(收益较大或损失较小) ,以及可供决策者选择的多个行动方案,并且不同的决策方案可计算出确定的收益值。这种问题可以用数学规划,包括线性规划、非线性规划、动态规划等方法求得最优解。但许多决策问题不一定追求最优解,只要能达到满意解即可。
某制衣厂准备生产牛仔裤,根据以往的经验,产品的销量可能为
1000,2000,3000,4000件四种,没见的成本为25元,销售为35元。若一周内卖不出,则只能按降价至20元出售。现在考虑生产1000,2000,3000,4000件这四种方案,问哪种为最优的生产方案?
解:由已知条件可得各方案的收益表如表1所示。
最大最大准则:
决策者是一切都往最好的方面想,是准求最大的收益,所以又称乐观主义准
则。使用这个方法时先计算每个收益的最大值,在比较找出其中最大的。
(i )算出各方案中的最大值,如图表2所示。
(ii )取出各最大值中的最大值。
Max{10000,20000,30000,40000}
因为f(A4)=40000,所以选取方案4.
最大最小准则:
采用这种方法时投资者在意的是安全保险,认为事物会向坏的方面发展,前途是悲观的,决策时挑选最坏结果中的最好的一个,所以又成悲观主义准则。使用这种方法时先把每一方案的最小收益求出,再找出其中的最大收益。
(i )求出各方案中的最小值,如图表3所示。
(ii )取出最小值中的最大值。
Max={10000,5000,0,-5000}
因此f(A1)=10000,所以选取方案1.
2.2 风险型决策
是研究环境条件不确定,但以某种概率出现的决策。风险型决策问题通常存在着多个可以用概率事先估算出来的自然状态,及决策者的一个确定目标和多个行动方案,并且可以计算出这些方案在不同状态下的收益值。决策准则有期望收益最大准则和期望机会损失最小准则。
风险情况下的决策方法通常有最大可能法,损益矩阵法和决策树法三种。 最大可能法是在一组自然状态中当某个状态出现的概率比其他状态的大得多,而它们相应的益损值差别又较小的情况下所采用的一种方法。此时可取该具
有最大概率的自然状态而不考虑其他决策,并按确定性决策问题方法进行决策。
益损矩阵由不同的益损值组成。设有n 种不同的自然状态,它们所出现的概率为p1,…,pn ,又有m 种不同的行动方案A1,…,Am ,并且用第i 种方案处理第i 种状态所得到的益损值为 ,则收益矩阵为m×n矩阵 ),而第i 种方案的益损期望值为Ei= ,i=1,…,m 。比较不同方案的期望值大小可选定一个较好的行动方案。比如,若决策目标是收益最大,则求max(Ei),若决策目标是损失最小,则求min(Ei)。
决策树是按一定的决策顺序画出的树状图。以一个产品的开发为例,它有一系列的决策:是否需要进行开发,选择什么样的生产模式和规模,确定生产费用、售价及可能的销售量等等,按此种决策序可画出决策树。决策者可在决策点,如对不同的开发费用赋予相应的主观概率,并对机会点,如对未来的销量用主观概率算出不同售价下的期望效用。选取期望效用最大者为该决策点的效用值,相应的决策就是这个点的最优决策。于是,由最后一个决策点逐步逆推,直到最初的决策点,就得到在诸决策点上的一串最优决策及相应的期望效用值。
红军步兵可能在平原,有隐蔽地方的开阔地,丘陵及水网地带与蓝军坦克部队遭遇,遭遇的概率分别为0.1,0.4,0.2,0.3. 遭遇时红军使用的武器可能有5中组合:
A1----磁性手雷,40火箭炮,82无坐力炮;
A2----磁性手雷,40火箭炮,82无坐力炮,85加农炮;
A3----磁性手雷,40火箭炮,82无坐力炮,反坦克导弹;
A4----磁性手雷,40火箭炮,82无坐力炮,85加农炮,反坦克导弹; A5----磁性手雷,40火箭炮,82无坐力炮,反坦克导弹,坦克。
其损益值在表4中给出。
期望值与下界值:
D(A1)=0.23-0.1=0.13
D(A2)=0.35-0.2=0.15
D(A3)=0.56-0.3=0.26
D(A4)=0.64-0.35=0.29
D(A5)=0.64-0.4=0.24
所以选择方案A5为最好。
采用矩阵决策的有点是:
对于复杂,计算量特别大的决策问题,他比决策树法更优越;
此法把决策问题化成了两个矩阵相乘,最后得到一个矩阵,从中找出最大或最小元素,这样就为利用计算机进行决策创造了有力条件。
2.3不确定型决策
是研究环境条件不确定,可能
出现不同的情况(事件) ,而情况出
现的概率也无法估计的决策。这
时,在特定情况下的收益是已知
的,可以用收益矩阵表示。不确定
型决策问题的方法有乐观法、悲观
法、乐观系数法、等可能性法和后悔值法等。乐观法又称冒险主义法,是对效益矩阵先求出在每个行动方法中的各个自然状态的最大效益值,再确定这些效益值的最大值,由此确定决策方案;悲观法又称保守法,是先求出在每个方案中的各自然状态的最小效益值,再求这些效益值的最大值,由此确定决策方案;乐观系数法是乐观法乘某个乐观系数;等可能性法是在决策过程中不能肯定何种状态容易出现时都假定它们出现的概率是相等的,再按矩阵决策求;后悔值法是先求出每种自然状态在各行动方案中的最大效益值,再求出未达到理想目标的后悔值法,由此一步步确定决策方案。借助控制论方法 ,组织环境可用状态变量来表征 要描述组织环境不确定性 ,最自然的方法 ,是采用概率论和数理统计学中的随机变量 。然而组织环境不确定性有多种来源
(如动态性、竞争性等) 并呈现出多种性态 ,对各种不确定性进行一一考察是非常困难的 ,有待进一步研究 .目前我们采用一种整合的观点 ,仅用一个随机变量 H来描述不确定性环境 ,它代表环境状态变量的聚集 .由于组织决策本质上是分布式决策 ,决策问题在决策单元之间是分布的, 各单元具有不同的决策任务, 所以只能观察到部分环境 ,这意味着组织状态变量在决策单元之间也是分布的
, 即有 H=(H1, H2, ., Hn ). Hi代表单元 i观察到的环境 , n ≥ 2为决策单元数 .对于决策任务 ,在信息、能量与行动方案之间存在着某种关联 [ 11 ] 对于一定的任务 t,一个人拥有的信息 I越多, 他完成该任务所消耗的能量e 越少, 即信息和能量之间存在着可以相互取代的双曲线形状的统计规律 1 (a) ).特别地 ,若信息量 I一定, 完成该任务的不同行动方案a 将消耗不同的能量, 而消耗最少能量的方案就是最佳方案, 可以认为能量是行动的拟二次函数. 经典决策理论中, 采用损失函数(或收益函数 )作为目标函数 ,显然能量消耗与决策损失对于决策偏好评估具有相同的意义. 基于以上认识, 组织决策问题从数学上可描述为di 中包含单元 i通过观察从环境获取的信息 ,以及通过信息交流从其他单元获取的信息 .对于一定的决策信息 d =[d 1, d 2, ., dn ],组织选择最佳的行动 aop t,使 min a E [e (a, H) .d ] = E [e (aop t, H) ](2)e (a, H)可用如下二阶 Taylo r展开式近似 [11 ] e (a, H) = B 0 -2B TA + A TQA (3)B 0= b0(H), A =[ai ], B =[bi (Hi) ], Q =[qij ]. bi是单元i 的观察函数, Q为对称矩阵 , qij =5a5i25eaj表示行动 ai与aj 的相互作用强度, 它表明策单元 i与 j所作决策之间的关联 . qii = 1;若 ai与 aj相互独立 ,则 qij = 0;否则 ,0
由于系统工程所面临的问题往往是多因素,多动态,复杂的系统的开发和规则问题,所以与其他决策问题相比,系统决策问题有其鲜明特色,如系统决策经常是多目标决策,一般需要采用决定性和定量性决策相结合的方法。但需要注意到系统决策过程中不能机械地运用这些方法,必须根据系统决策的特殊性,充分发挥系统工程的集体智慧和创造力,依靠领导者的密切配合,才能较好的完成决
策任务。
参考文献:
《不确定性环境中组织结构设计》 作者: 方卫国,周弘 《数学建模》 冶金出版社
《系统工程原理》 科学出版社
《决策与优化》 海洋出版社
《模糊多目标多人决策与对策》 作者:梁国业,缪建平 作者:谭跃进,陈英武,金光,罗鹏程 作者:焦宝聪 国防工业出版社 作者:李登峰
决策论与应用决策论分析问题
1. 决策论的简要介绍:
决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。在实际生活与生产中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。决策论是在概率论的基础上发展起来的。随着概率论的发展,早在1763年贝叶斯决策论相关书籍斯发表条件概率定理时起,统计判定理论就已发萌芽。1815年拉普拉斯用此定理估计第二天太阳还将升起的概率,把统计判定理论推向一个新阶段。统计判定理论实际上是在风险情况下的决策理论。这些理论和对策理论概念上的结合发展成为现代的决策论。决策论在包括安全生产在内的许多领域都有着重要应用。
决策是人类社会的一项重要活动, 它关系到人类生活的各个方面,是为达到某种目的而从若干问题求解方案中选出一个最优或合理方案的过程。
因此,决策是人们在各项工作中的一种重要选择行为。无论是行动方案的确定,还是重大发展战略的制定;是一个领导干部的选拔,还是一种产品的研制生产;是一个企业的生产管理,还是一个国家或地区的产业政策,都是有一系列决策活动来完成的。所以决策的正确与否是关系到事业的成败和利益的得失的大事。决策正确带来的是“一本万利”,而决策失误也是“最大的失误”。关于这一点,著名科学家﹑诺贝尔奖获得者H.A. 西蒙有句名言:“管理就是决策”,决策贯穿于管理的全过程。这也就是说,一切管理工作的核心就是决策。
在系统工程的工作过程中,有系统开发得到的若干解决问题的方案,经过系统建模﹑系统分析及系统评价等步骤,最终必须从备选方案中为决策者选出最佳的开发方案。这一程序是系统工程辩证程序中最后一个,也是最重要的一个,这就是系统决策。
H.A. 西蒙把决策过程同现代的管理学科﹑计算机技术和自动化技术结合起来,将其划分为四个重要阶段:找出制定决策的理由;找到可能的行动方案;在诸行动方案中进行抉择;对已进行的抉择进行评价。尽管不同的决策者在不同的决策场合对上述4个阶段的看法不一样,但这四个部分加在一起却构成了决策者所要做的主要工作。
以上四个阶段交织在一起,就形成了决策的过程。第一阶段是调查环境,寻求决策的条件和依据,即“情报阶段”;第二个阶段是创造﹑制定和分析可能采取行动的行动方案,即“设计阶段”;第三阶段是从可子利用的备选方案中选出一个行动方案,即“抉择阶段”;第四阶段是决策的事实与评价,西蒙称其为“审查活动”,其实是对过去的抉择进行评价。
现代计算机技术﹑管理科学等的发展,给决策制定的过程赋予了新的内容和含义。在情报和设计阶段,主要是依靠于可靠﹑准确﹑及时的基本信息,因此管理信息系统(management information system , MIS )就成为当代决策的重要技术基础;而在决择和评价阶段的主要技术措施就是模型方法,主要是指管理科学、
运筹学、系统工程中模型方法(MS/OR/SE)。将上述两部分技术集成在一起,利用先进的计算机软硬件技术,实现上述决策过程,开发成有好的人机系统,这就是决策支持系统(decision support system, DSS )。
2. 决策问题的分类与分析方法:
决策问题根据不同性质通常可以分为确定型、风险型(又称统计型或随机型)
和不确定型三种。
2.1确定型决策的分析:
是研究环境条件为确定情况下的决策。如某工厂每种产品的销售量已知,研
究生产哪几种产品获利最大,它的结果是确定的。确定型决策问题通常存在着一个确定的自然状态和决策者希望达到的一个确定目标(收益较大或损失较小) ,以及可供决策者选择的多个行动方案,并且不同的决策方案可计算出确定的收益值。这种问题可以用数学规划,包括线性规划、非线性规划、动态规划等方法求得最优解。但许多决策问题不一定追求最优解,只要能达到满意解即可。
某制衣厂准备生产牛仔裤,根据以往的经验,产品的销量可能为
1000,2000,3000,4000件四种,没见的成本为25元,销售为35元。若一周内卖不出,则只能按降价至20元出售。现在考虑生产1000,2000,3000,4000件这四种方案,问哪种为最优的生产方案?
解:由已知条件可得各方案的收益表如表1所示。
最大最大准则:
决策者是一切都往最好的方面想,是准求最大的收益,所以又称乐观主义准
则。使用这个方法时先计算每个收益的最大值,在比较找出其中最大的。
(i )算出各方案中的最大值,如图表2所示。
(ii )取出各最大值中的最大值。
Max{10000,20000,30000,40000}
因为f(A4)=40000,所以选取方案4.
最大最小准则:
采用这种方法时投资者在意的是安全保险,认为事物会向坏的方面发展,前途是悲观的,决策时挑选最坏结果中的最好的一个,所以又成悲观主义准则。使用这种方法时先把每一方案的最小收益求出,再找出其中的最大收益。
(i )求出各方案中的最小值,如图表3所示。
(ii )取出最小值中的最大值。
Max={10000,5000,0,-5000}
因此f(A1)=10000,所以选取方案1.
2.2 风险型决策
是研究环境条件不确定,但以某种概率出现的决策。风险型决策问题通常存在着多个可以用概率事先估算出来的自然状态,及决策者的一个确定目标和多个行动方案,并且可以计算出这些方案在不同状态下的收益值。决策准则有期望收益最大准则和期望机会损失最小准则。
风险情况下的决策方法通常有最大可能法,损益矩阵法和决策树法三种。 最大可能法是在一组自然状态中当某个状态出现的概率比其他状态的大得多,而它们相应的益损值差别又较小的情况下所采用的一种方法。此时可取该具
有最大概率的自然状态而不考虑其他决策,并按确定性决策问题方法进行决策。
益损矩阵由不同的益损值组成。设有n 种不同的自然状态,它们所出现的概率为p1,…,pn ,又有m 种不同的行动方案A1,…,Am ,并且用第i 种方案处理第i 种状态所得到的益损值为 ,则收益矩阵为m×n矩阵 ),而第i 种方案的益损期望值为Ei= ,i=1,…,m 。比较不同方案的期望值大小可选定一个较好的行动方案。比如,若决策目标是收益最大,则求max(Ei),若决策目标是损失最小,则求min(Ei)。
决策树是按一定的决策顺序画出的树状图。以一个产品的开发为例,它有一系列的决策:是否需要进行开发,选择什么样的生产模式和规模,确定生产费用、售价及可能的销售量等等,按此种决策序可画出决策树。决策者可在决策点,如对不同的开发费用赋予相应的主观概率,并对机会点,如对未来的销量用主观概率算出不同售价下的期望效用。选取期望效用最大者为该决策点的效用值,相应的决策就是这个点的最优决策。于是,由最后一个决策点逐步逆推,直到最初的决策点,就得到在诸决策点上的一串最优决策及相应的期望效用值。
红军步兵可能在平原,有隐蔽地方的开阔地,丘陵及水网地带与蓝军坦克部队遭遇,遭遇的概率分别为0.1,0.4,0.2,0.3. 遭遇时红军使用的武器可能有5中组合:
A1----磁性手雷,40火箭炮,82无坐力炮;
A2----磁性手雷,40火箭炮,82无坐力炮,85加农炮;
A3----磁性手雷,40火箭炮,82无坐力炮,反坦克导弹;
A4----磁性手雷,40火箭炮,82无坐力炮,85加农炮,反坦克导弹; A5----磁性手雷,40火箭炮,82无坐力炮,反坦克导弹,坦克。
其损益值在表4中给出。
期望值与下界值:
D(A1)=0.23-0.1=0.13
D(A2)=0.35-0.2=0.15
D(A3)=0.56-0.3=0.26
D(A4)=0.64-0.35=0.29
D(A5)=0.64-0.4=0.24
所以选择方案A5为最好。
采用矩阵决策的有点是:
对于复杂,计算量特别大的决策问题,他比决策树法更优越;
此法把决策问题化成了两个矩阵相乘,最后得到一个矩阵,从中找出最大或最小元素,这样就为利用计算机进行决策创造了有力条件。
2.3不确定型决策
是研究环境条件不确定,可能
出现不同的情况(事件) ,而情况出
现的概率也无法估计的决策。这
时,在特定情况下的收益是已知
的,可以用收益矩阵表示。不确定
型决策问题的方法有乐观法、悲观
法、乐观系数法、等可能性法和后悔值法等。乐观法又称冒险主义法,是对效益矩阵先求出在每个行动方法中的各个自然状态的最大效益值,再确定这些效益值的最大值,由此确定决策方案;悲观法又称保守法,是先求出在每个方案中的各自然状态的最小效益值,再求这些效益值的最大值,由此确定决策方案;乐观系数法是乐观法乘某个乐观系数;等可能性法是在决策过程中不能肯定何种状态容易出现时都假定它们出现的概率是相等的,再按矩阵决策求;后悔值法是先求出每种自然状态在各行动方案中的最大效益值,再求出未达到理想目标的后悔值法,由此一步步确定决策方案。借助控制论方法 ,组织环境可用状态变量来表征 要描述组织环境不确定性 ,最自然的方法 ,是采用概率论和数理统计学中的随机变量 。然而组织环境不确定性有多种来源
(如动态性、竞争性等) 并呈现出多种性态 ,对各种不确定性进行一一考察是非常困难的 ,有待进一步研究 .目前我们采用一种整合的观点 ,仅用一个随机变量 H来描述不确定性环境 ,它代表环境状态变量的聚集 .由于组织决策本质上是分布式决策 ,决策问题在决策单元之间是分布的, 各单元具有不同的决策任务, 所以只能观察到部分环境 ,这意味着组织状态变量在决策单元之间也是分布的
, 即有 H=(H1, H2, ., Hn ). Hi代表单元 i观察到的环境 , n ≥ 2为决策单元数 .对于决策任务 ,在信息、能量与行动方案之间存在着某种关联 [ 11 ] 对于一定的任务 t,一个人拥有的信息 I越多, 他完成该任务所消耗的能量e 越少, 即信息和能量之间存在着可以相互取代的双曲线形状的统计规律 1 (a) ).特别地 ,若信息量 I一定, 完成该任务的不同行动方案a 将消耗不同的能量, 而消耗最少能量的方案就是最佳方案, 可以认为能量是行动的拟二次函数. 经典决策理论中, 采用损失函数(或收益函数 )作为目标函数 ,显然能量消耗与决策损失对于决策偏好评估具有相同的意义. 基于以上认识, 组织决策问题从数学上可描述为di 中包含单元 i通过观察从环境获取的信息 ,以及通过信息交流从其他单元获取的信息 .对于一定的决策信息 d =[d 1, d 2, ., dn ],组织选择最佳的行动 aop t,使 min a E [e (a, H) .d ] = E [e (aop t, H) ](2)e (a, H)可用如下二阶 Taylo r展开式近似 [11 ] e (a, H) = B 0 -2B TA + A TQA (3)B 0= b0(H), A =[ai ], B =[bi (Hi) ], Q =[qij ]. bi是单元i 的观察函数, Q为对称矩阵 , qij =5a5i25eaj表示行动 ai与aj 的相互作用强度, 它表明策单元 i与 j所作决策之间的关联 . qii = 1;若 ai与 aj相互独立 ,则 qij = 0;否则 ,0
由于系统工程所面临的问题往往是多因素,多动态,复杂的系统的开发和规则问题,所以与其他决策问题相比,系统决策问题有其鲜明特色,如系统决策经常是多目标决策,一般需要采用决定性和定量性决策相结合的方法。但需要注意到系统决策过程中不能机械地运用这些方法,必须根据系统决策的特殊性,充分发挥系统工程的集体智慧和创造力,依靠领导者的密切配合,才能较好的完成决
策任务。
参考文献:
《不确定性环境中组织结构设计》 作者: 方卫国,周弘 《数学建模》 冶金出版社
《系统工程原理》 科学出版社
《决策与优化》 海洋出版社
《模糊多目标多人决策与对策》 作者:梁国业,缪建平 作者:谭跃进,陈英武,金光,罗鹏程 作者:焦宝聪 国防工业出版社 作者:李登峰