理论与实践理论月刊2011年第9期
国际气候合作中的非合作性博弈困境及其超越
李
强
(天津外国语大学涉外法政学院,天津300204)
*
摘要:以“囚徒困境”为主要表现形式的非合作博弈是困扰国际气候谈判进展缓慢的关键障碍,其原因就在于各国(国家集团)在气候变化问题上的个体利益诉求与国际社会的集体利益诉求之间存在冲突。如果在个体理性与集体理性的协调上失败,极有可能导致集体理性的失控,最终导致人类赖以生存的气候系统崩溃。因此,探讨非合作博弈困境的内部机理并寻求其破解途径,就成为解决国际气候谈判困境的关键。
关键词:国际气候合作;非合作性博弈;理性中图分类号:D815
文献标识码:A
文章编号:1004-0544(2011)09-0096-04
国际气候合作在性质上是各国在保障自身利益前提下追求共同利益的博弈,其目的是建立制度以保证公平公正的环保责任承担。气候变化是一个极其复杂而长期的全球性问题,关系到各国的根本利益和长远利益。国际气候谈判是各国在高度不确定性条件下的集体决策过程,在利益冲突之间寻求妥协和平衡的政治过程。在这个过程中,虽然参与合作的世界各国具有共同利益,但共同利益的存在并不能保证合作一定产生。国家的个体理性决定的利益偏好差异仍然是导致集体行动困境的根本原因,除非克服这种障碍,否则共同利益根本无法实现。
定采取什么样的行动对自己最有利,同时相信他们的对手同自己一样也遵从理性而且同样会为胜利而进行多次计算。
博弈包含一些基本要素:博弈参与者,每场博弈都有不少于两个参与者或行为者;参与者可获得的收益,因为不同的参与者的价值体系不同,所以他们期望获得的收益也不同;博弈的基本规则,只有遵守规则才能使博弈正常进行;信息条件,它决定每个参与者获得相关信息(周围的环境和其他参与者的决策)的数量、质量以及便捷程度(获得信息的速度);参与者为达目的而采取的策略;进行博弈的总体环境,不论参与者是否对此有充分认识;竞争行为的互动,在这种互动过程中,参与者的每次选择都会促使其他参与者改变选择。
[2]
一、博弈与非合作性博弈
所谓博弈,是指某些个人或组织做出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包括现实生活中大量的合作和冲突现象。博弈论也称对策论,研究的核心是决策主体的行为发生直接作用时的决策以及这种决策的均衡问题。
[1]
从不同的角度可以对博弈进行不同的分类。从能否达成有约束力的角度划分,博弈可以划分为合作博弈(CooperativeGame)和非合作博弈(Non-Cooperative
博弈论首先是作为自然科学理论出现的,建立在抽
Game)。如果博弈参与者能够在行为时达成有约束力的协议,则属于合作博弈。反之,如果不能强制他方遵守协议,各参与者只能选择自己的最优战略,则是非合作博弈。前者的特点是集体理性、效率、公平和公正,后者则强调个体理性、个体最优决策。如果根据参与者的出场顺序进行划分,博弈可以分为静态博弈(StaticGame)和动态博弈(Dynamic
象推理的基础之上,是数学和逻辑的一种结合。在社会科学领域,博弈论运用数学方法分析行为体在博弈中的互动行为所产生的可能后果。在博弈过程中,每个行为体都有自己的策略、目标和偏好。博弈论也将人的行为具有理性作为假设前提,因为“如果假设人类所有的行为都是荒谬的、神经质的或者反常的话,我们就不会有博弈论或其他社会科学理论了”。博弈论研究的重点不在于博弈者采取的实际行动,而是博弈者采取什么样的行为才能在博弈中获胜(将收益最大化或损失最小化)。如果人们希望在特定的环境中获胜(即希望实现那些会受到他人阻止的目标),博弈论就可以分析他们的思维过程。在思维过程中,博弈者要判断和决
Game)。静态博弈是指博弈参与者同时选择行动或在对前者行动一无所知的情况下没有同时采取行动。动态博弈指参与者行动有先后顺序,而且最后行动者能够观察到先行动者的选择。如果考虑参与者对其他参与者的认知因素,博弈还可以分为完全信息博弈和不完全信息博弈,其区别在于每一参与者是否对其他参与者的特征、战略和支付函数
*基金项目:天津市高等学校人文社会科学研究项目(20092701)。
作者简介:李强(1974-),男,山东德州人,法学博士,天津外国语大学涉外法政学院讲师。
-
96-
理论与实践理论月刊2011年第9期
有确切的了解。
非合作性博弈反映的是个体理性与集体理性之间的悖论问题,理性个体对利益的追求不能满足集体理性或社会福利最大化的要求,导致集体理性失控。集体行动之所以出现困境源于个体理性和集体理性的磨合出现了问题,[3]体现在博弈中就是非合作性博弈。囚徒困境博弈、智猪博弈、斗鸡博弈和盟主博弈都属于非合作性博弈,但它们表现出的集体行动困境的特点不尽相同:在囚徒困境博弈中,个体理性无法导出集体理性;智猪博弈在个体理性与集体理性的关系上形成的纳什均衡是“多劳不多得,少劳不少得”;在斗鸡博弈下,“一人干活,另一人不劳而获”;盟主博弈则是另外一种情形,它是一种不对称的博弈,既受到收益分配问题的困扰,也含有个体理性和集体理性的冲突。
[4]
囚徒困境博弈矩阵
B1(坦白)
A1(坦白)A2(抵赖)
(2,2)纳什均衡,最次
(1,4)
B2(抵赖)(4,1)(3,3)
纳什均衡是:A1B1都坦白,帕累托无效率,体现了个体理性与集体理性的矛盾。
资料来源:崔大鹏著,《国际气候合作的政治经济学分析》,第36页。
从博弈矩阵可以看出,作为理性人,每个囚徒都有坦白的愿望。A的收益顺序是A2B1>A1B1>A2B2>A1B2,而B的收益顺序是B2A1>B1A1>B2A2>B1A2。虽然如果A和B都保持沉默,可以达到帕累托最优解,但这个结果并不稳定,因为两个囚徒都担心对方背叛。所以,博弈双方的最优理性战略都是背叛,纳什均衡结果是A2B2,这是一个帕累托无效的纳什均衡解。基欧汉对囚徒困境的理解颇为深刻:“在需要集体行动的状态中,合作对获得一种为所有相关成员共同享用的物品是必要的,不管这些成员是否为这种物品的供应作出贡献。当每一个成员为供应这种物品所承担的成本,与总的成本相比非常小的时候,利己的个体可能会作出估算,认为他们如果不作贡献的话会好一点,因为他们的贡献对自己来说是有成本的,而其贡献对这种物品最终被生产出来却只会产生微不足道的影响。因此就像在囚徒困境中一样,对一个利己主义者来说,占优势的战略是背叛而不是对这种物品的生产作出贡献”。
[6]
二、国际气候合作与非合作性博弈
全球气候变化问题上的国际合作,本质上就是集体行动是否可行以及如何实现的问题。国际气候合作要取得成功,首要问题就是实现个体理性与集体理性保持一致,避免出现集体理性失控现象。产权界定问题是全球公共物品共同面临的难题,全球气候变化问题也不例外。由于缺乏具体的产权界定,所有的国家为最大限度地获得经济利益,将滥用气候资源,不受限制地排放温室气体,从而最终导致哈丁所谓的“公用地的悲剧”。因此,要实现共同利益,各国需要一致同意合作以减少化石能源消耗。但是,合作协议是不稳定的,因为任何一个国家如果搭便车将获得更大利益。从这个角度来看,“囚徒困境”博弈最具有代表性。囚徒困境的创造本身就部分地奠定了非合作性博弈的理论基础,并且它可以作为实际生活中的许多现象的一个抽象概括。
[5]
囚徒困境说明的是
个体理性行为的总和导致集体非理性的反论问题。这是国际合作中存在的一个关键问题,即在以逐利原则为主导的个体行动组成的世界中,即使共同利益存在,个体往往也不会主动为这种共同利益去努力。从囚徒困境中我们可以得出一个很重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡。
[5]
美国
·基欧汉(RobertKeohane)在阐述新自由制度学者罗伯特
主义的相关理论时,也采用“囚徒困境”作为分析框架。基欧汉指出:“不是世界政治或者国际政治经济中的所有形势都可以采取囚徒困境的形式表现出来,但是大部分都是如此的,由囚徒困境所提出的问题对本书讨论的合作与纷争问题是关键性的”,而且“奥尔森(MancurOlson)阐述的集体行动的逻辑,本质上与囚徒困境的逻辑是一样的”。
[6]
在国际气候合作中,囚徒困境现象表现得最为明显和突出。在国际气候合作中,特别是在温室气体减排问题上,博弈双方的最优理性战略也都是背叛。如果每个国家都不受限制地排放温室气体,而且都认为,当他国不受限制地排放二氧化碳的同时,即使自己单方面限制排放,对延缓全球气候变化也不会产生根本性助益;或者每个国家都认为,在其他国家联合限制二氧化碳排放量的时候,自己单方面扩大二氧化碳的排放量不会对全球气候变化产生决定性影响时,最终必将重演全球的“公用地的悲剧”。在囚徒困境博弈情境下,博弈双方出于个体理性的最优选择都是不合作,所形成的纳什均衡解是典型的集体理性失控。在国际气候合作中出现这种局面则意味着应对气候变化的努力彻底失败,气候系统将趋于崩溃。所以,在国际气候合作中如何避免出现囚徒困境式博弈就成了合作成功与否的关键问题。美国对于京都机制就采取了囚徒困境博弈思维,强调如果发展中国家,特别是中国和印度等发展中大国不参与国际减排协议,即使美国采取减排行动也不会对全球温室气体减排产生根本性影响。同样,对于广大发展中国家来说,如果发达国家回避历史责任,坚持以发展中国家承诺量化
奥尔
[7]
森不赞成用囚徒困境解释集体行动的困境,认为它完全不适用小集团,但可以用来解释大集团集体行动的困境。
奥
尔森的理由是:“就大集团而言,其获得的任何集体物品的数量离最优水平越远,它就越不可能采取行动去获取哪怕是最小数量的这类物品。简而言之,集团越大,就越不能去增进它的共同利益”。的分析模式。
囚徒困境博弈描述的是这样一个情景:两个囚徒共同犯下一起严重罪行。如果两个囚徒都保持沉默,就难以取得他们犯罪的证据,在这种情况下,他们会被判较轻的刑罚,判入狱1年。如果他们其中一人坦白了,并提供另一个人犯罪的证据,那么坦白者就会被立即释放,而另一囚徒就会面临入狱30年的刑罚。如果两个囚徒都坦白并互相提供对方犯罪的证据,那么两个囚徒都会被判入狱15年,如图所示:
[8]
从奥尔森的申辩中可以看出,在解
释大集团的集体行动的困境时,囚徒困境可以用作代表性
-
97-
减排指标为达成减排协议的前提,发展中国家为了自身发展利益,也会在国际气候谈判中采取抵制态度,导致国际气候合作陷入僵局。
基础上,如果博弈方认为自己承担的成本不公平,极有可能在个体理性逐利动机的强烈驱使下退出博弈。
应对气候变化的责任承担问题是国际气候合作中各国制定气候政策的前提和基础,因此各国都把责任承担是否公平视作国际气候谈判的核心问题。在国际气候变化谈判中,成员之间承担的责任越公平,其对于合作的态度就越积极。[11]责任承担的公平性应该从国家的发展程度、国家具备的能力和个人发展权利三个方面给予保障。
三、超越“囚徒困境”博弈的几种可能途径
按照博弈论的解释,要解决囚徒困境有三种可能的途径:第一,博弈各方要建立相互信任关系。国家之间特别是发达国家与发展中国家之间应该建立良好的互信关系,保持信息沟通渠道畅通。发达国家应该遵循“共同但有区别的责任”原则,在温室气体减排方面率先采取行动,换取发展中国家的信任。发达国家应该切实履行自己的承诺,向发展中国家提供资金和技术援助,帮助其提高减缓和适应气候变化的能力。发展中国家要认真履行在《联合国气候变化框架公约》和《京都议定书》中承担的相应义务,表明参与国际气候合作的诚意,并在力所能及的基础上,按照自愿原则降低温室气体排放,待到能力达到一定程度后再考虑量化减排问题。发达国家之间也应该建立互信关系,尤其是欧美要放弃在气候问题上的争吵,在温室气体减排方面做出实际行动。第二,博弈各方签订有约束力的合约。基欧汉指出,国家为追求共同利益创立了国际机制。国家发现自己困在囚徒困境中,但由于国际机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。机制可以向国家提供信息或降低交易成本从而促进合作。国际社会一直致力于签订一项有约束力的国际协议,以“硬法”的形式对各国在应对气候变化行动中应承担的相关义务做出具体安排,形成有效的国际气候机制,以保证气候变化行动顺利进行。基欧汉指出:“总的来说,国际机制通过降低被欺骗的可能性,使合作成为更加明智的选择。……如同广义上定义的国际法一样,它们的功能就是要使人类行动符合可预测的模式,从而使预计的行动能够在手段和目的之间获得一种理性的关系中前进”。
[6][9]
1.从国家的发展程度看,要保证责任承担的公平性,就必须确定“共同但有区别的责任”原则。全球气候变化问题危及全人类的共同利益,每个国家在应对这一危机时都必须承担共同的责任。然而,无论是从历史排放还是从现实排放来看,发达国家都应对温室气体排放造成的全球气候变化承担主要责任。自工业革命以来,发达国家消耗的煤炭和石油产生的温室气体导致大气中二氧化碳含量上升了
60%。目前,发达国家人口仅占世界总人口的25%,却已经并仍在消耗着世界80%的能源,发达国家的二氧化碳排放量依然占到世界排放总量的75%。以人均排放为例,发达国家的人均排放量为3.12吨,而发展中国家的这一数字尚不及其九分之一。如果要发达国家和发展中国家均等地承担责任,势必严重违反可持续发展原则所大力倡导的公平原则。因此,国际气候合作必须遵循“共同但有区别的责任”原则。《联合国气候变化框架公约》中明确规定:“气候变化的全球性要求所有国家根据其共同但有区别的责任和各自的能力及其社会和经济条件,尽可能开展最广泛的合作,并参与有效和适当的国际应对行动。”《京都议定书》和“巴厘岛路线图”为保证在应对气候变化问题上体现真正的公平,对“共同但有区别的责任”原则再次给予了强调。根据这一原则的要求,发达国家有义务承诺硬性减排的量化指标并率先采取减排行动。同时,为保证国际气候合作的广泛参与性,发达国家必须向发展中国家提供充足的资金和先进的技术以提高其减缓和适应气候变化的能力。
第三,重复博弈在一定程度上能够起到缓解困境的效用。囚徒困境之所以出现集体行动的悖论,在很大程度上因
2.从国家具备的能力来看,公平的责任承担要求不同的国家在应对气候变化的国际合作中应该作出不同的贡献。发达国家对气候变化的脆弱性相对发展中国家要低,而且在资金和技术上都拥有更高的应对气候变化的能力。各国都肩负着恢复和维持气候系统以实现其可持续发展的共同责任,能力高的国家理应作出更大的贡献,这对能力较低的国家参与合作将产生示范和激励的作用。发达国家应该履行已经在《联合国气候变化框架公约》和《京都议定书》中作出的承诺,向发展中国家提供资金和技术支持,帮助发展中国家提高减缓和适应气候的能力。
为博弈是一次完成的,选择背叛的博弈者不用担心在下一轮博弈中遭受报复。然而,国际气候合作中的博弈却并非一次博弈,而是多次重复博弈。“重复囚徒困境”允许双方从合作中得到好处,同时也提供了一方占另一方便宜的或双方都不合作的可能。在这种情况下,每一方采取合作或背叛战略后都会在下一轮博弈中面临被对方奖励或惩罚,因此博弈方最佳选择都是“一报还一报”(TitforTat)策略,即模仿对方上一步的选择。先采取合作行动的一方相信自己的合作行为能换得对方的配合,否则将在下一轮博弈中惩罚对方。“一报还一报”的稳定成功的原因在于“它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作,它的清晰性使它容易被对方理解,从而引出长期的合作”。
[10]
3.从个人发展权利看,责任承担的公平性强调对于人均平等的保障。按照可持续发展理念的要求,每个人都有平等享用大气资源的权利,国际社会不能按照发展程度高低和贫富状况差异作为分配大气资源的基础。在全球气候变化问题上,发达国家主张温室气体减排必须全球参与,尤其是发展中大国如中国、印度等国家必须承担强制性减排份额,以此作为发达国家承担具体减排份额的前提条件。发展中国家强调,一国的排放权等于国家人口与世界人均排放
温室气体减排方面
就存在“重复囚徒困境”博弈,欧盟不断提出新的减排目标并承诺如果其他发达国家减排,欧盟还将扩大减排力度。需要指出的是,这三种可能途径必须建立在成本支出公平的
-
98-
权的乘积;国际气候谈判必须建立在人均能源消耗和人均温室气体排放的基础之上。如果单纯根据国家排放总量按比例减排,势必对发展中国家的发展造成严重伤害,威胁到其维系生存问题的温室气体排放。这种形式上的公平违背了可持续发展的公平原则,造成了个人发展权利实际上的不平等。如果发展中国家面临既无技术又无资金的双重困境,那么它们在国际气候合作的博弈中极易选择消极的政策甚至退出国际合作,从而导致国际气候合作失败。
[3]于宏源.国际环境合作中的集体行动的逻辑[J].世界经济与政治,2007,(5).
[4]崔大鹏.国际气候合作的政治经济学分析[M].北京:商务印书馆,2003.
[5]张维迎.博弈论与信息经济学[M].上海:三联书店和上海出版社,2002.
[6]〔美〕罗伯特·基欧汉.霸权之后———世界政治经济中的合作与纷争[M].上海:上海世纪出版集团,2006.
[7]高春芽.集体行动的逻辑及其困境[J].武汉理工大学学报,2008,
四、结语
应对全球气候变化的国际合作是解决气候危机的必然选择。在这一进程中,各国(国家集团)的个体利益与全人类的共同利益必然会发生激烈的碰撞,“囚徒困境”始终是困扰国际气候合作总体进展的障碍,其关键就在于如何在协调个体理性的基础上实现集体理性。在国际气候合作实践中,各国都应该正确地认识到,全人类的共同利益高于个体利益,当长期利益与短期利益、全人类利益与个体利益发生冲突时,必须通过理性选择,做出正确的决策。参考文献:
[1]王杰.国际机制论[M].北京:新华出版社,2002.
[2]〔美〕詹姆斯·多尔蒂,小罗伯特·普法尔茨格拉夫.争论中的国际关系理论[M].北京:世界知识出版社,2003.
(1).
[8]〔美〕曼瑟尔·奥尔森.集体行动的逻辑[M].上海:上海三联书店,
1995.
[9]陈宏.博弈论与战略互动[A].秦亚青.理性与国际合作:自由主义·国际关系理论研究[C].北京:世界知识出版社,2008;〔美〕莉萨马丁.利益、权力和多边主义[A].〔美〕莉萨·马丁,贝思·西蒙斯.国际制度[C].上海:上海世纪出版集团,2006.
[10]〔美〕罗伯特·阿克塞尔罗德.合作的进化[M].上海:上海世纪出版集团,2007.
[11]张海滨.中国在国际气候变化谈判中的立场:连续性与变化及其原因探析[J].世界经济与政治,2006,(10).
责任编辑
文
嵘
-
99-
理论与实践理论月刊2011年第9期
国际气候合作中的非合作性博弈困境及其超越
李
强
(天津外国语大学涉外法政学院,天津300204)
*
摘要:以“囚徒困境”为主要表现形式的非合作博弈是困扰国际气候谈判进展缓慢的关键障碍,其原因就在于各国(国家集团)在气候变化问题上的个体利益诉求与国际社会的集体利益诉求之间存在冲突。如果在个体理性与集体理性的协调上失败,极有可能导致集体理性的失控,最终导致人类赖以生存的气候系统崩溃。因此,探讨非合作博弈困境的内部机理并寻求其破解途径,就成为解决国际气候谈判困境的关键。
关键词:国际气候合作;非合作性博弈;理性中图分类号:D815
文献标识码:A
文章编号:1004-0544(2011)09-0096-04
国际气候合作在性质上是各国在保障自身利益前提下追求共同利益的博弈,其目的是建立制度以保证公平公正的环保责任承担。气候变化是一个极其复杂而长期的全球性问题,关系到各国的根本利益和长远利益。国际气候谈判是各国在高度不确定性条件下的集体决策过程,在利益冲突之间寻求妥协和平衡的政治过程。在这个过程中,虽然参与合作的世界各国具有共同利益,但共同利益的存在并不能保证合作一定产生。国家的个体理性决定的利益偏好差异仍然是导致集体行动困境的根本原因,除非克服这种障碍,否则共同利益根本无法实现。
定采取什么样的行动对自己最有利,同时相信他们的对手同自己一样也遵从理性而且同样会为胜利而进行多次计算。
博弈包含一些基本要素:博弈参与者,每场博弈都有不少于两个参与者或行为者;参与者可获得的收益,因为不同的参与者的价值体系不同,所以他们期望获得的收益也不同;博弈的基本规则,只有遵守规则才能使博弈正常进行;信息条件,它决定每个参与者获得相关信息(周围的环境和其他参与者的决策)的数量、质量以及便捷程度(获得信息的速度);参与者为达目的而采取的策略;进行博弈的总体环境,不论参与者是否对此有充分认识;竞争行为的互动,在这种互动过程中,参与者的每次选择都会促使其他参与者改变选择。
[2]
一、博弈与非合作性博弈
所谓博弈,是指某些个人或组织做出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包括现实生活中大量的合作和冲突现象。博弈论也称对策论,研究的核心是决策主体的行为发生直接作用时的决策以及这种决策的均衡问题。
[1]
从不同的角度可以对博弈进行不同的分类。从能否达成有约束力的角度划分,博弈可以划分为合作博弈(CooperativeGame)和非合作博弈(Non-Cooperative
博弈论首先是作为自然科学理论出现的,建立在抽
Game)。如果博弈参与者能够在行为时达成有约束力的协议,则属于合作博弈。反之,如果不能强制他方遵守协议,各参与者只能选择自己的最优战略,则是非合作博弈。前者的特点是集体理性、效率、公平和公正,后者则强调个体理性、个体最优决策。如果根据参与者的出场顺序进行划分,博弈可以分为静态博弈(StaticGame)和动态博弈(Dynamic
象推理的基础之上,是数学和逻辑的一种结合。在社会科学领域,博弈论运用数学方法分析行为体在博弈中的互动行为所产生的可能后果。在博弈过程中,每个行为体都有自己的策略、目标和偏好。博弈论也将人的行为具有理性作为假设前提,因为“如果假设人类所有的行为都是荒谬的、神经质的或者反常的话,我们就不会有博弈论或其他社会科学理论了”。博弈论研究的重点不在于博弈者采取的实际行动,而是博弈者采取什么样的行为才能在博弈中获胜(将收益最大化或损失最小化)。如果人们希望在特定的环境中获胜(即希望实现那些会受到他人阻止的目标),博弈论就可以分析他们的思维过程。在思维过程中,博弈者要判断和决
Game)。静态博弈是指博弈参与者同时选择行动或在对前者行动一无所知的情况下没有同时采取行动。动态博弈指参与者行动有先后顺序,而且最后行动者能够观察到先行动者的选择。如果考虑参与者对其他参与者的认知因素,博弈还可以分为完全信息博弈和不完全信息博弈,其区别在于每一参与者是否对其他参与者的特征、战略和支付函数
*基金项目:天津市高等学校人文社会科学研究项目(20092701)。
作者简介:李强(1974-),男,山东德州人,法学博士,天津外国语大学涉外法政学院讲师。
-
96-
理论与实践理论月刊2011年第9期
有确切的了解。
非合作性博弈反映的是个体理性与集体理性之间的悖论问题,理性个体对利益的追求不能满足集体理性或社会福利最大化的要求,导致集体理性失控。集体行动之所以出现困境源于个体理性和集体理性的磨合出现了问题,[3]体现在博弈中就是非合作性博弈。囚徒困境博弈、智猪博弈、斗鸡博弈和盟主博弈都属于非合作性博弈,但它们表现出的集体行动困境的特点不尽相同:在囚徒困境博弈中,个体理性无法导出集体理性;智猪博弈在个体理性与集体理性的关系上形成的纳什均衡是“多劳不多得,少劳不少得”;在斗鸡博弈下,“一人干活,另一人不劳而获”;盟主博弈则是另外一种情形,它是一种不对称的博弈,既受到收益分配问题的困扰,也含有个体理性和集体理性的冲突。
[4]
囚徒困境博弈矩阵
B1(坦白)
A1(坦白)A2(抵赖)
(2,2)纳什均衡,最次
(1,4)
B2(抵赖)(4,1)(3,3)
纳什均衡是:A1B1都坦白,帕累托无效率,体现了个体理性与集体理性的矛盾。
资料来源:崔大鹏著,《国际气候合作的政治经济学分析》,第36页。
从博弈矩阵可以看出,作为理性人,每个囚徒都有坦白的愿望。A的收益顺序是A2B1>A1B1>A2B2>A1B2,而B的收益顺序是B2A1>B1A1>B2A2>B1A2。虽然如果A和B都保持沉默,可以达到帕累托最优解,但这个结果并不稳定,因为两个囚徒都担心对方背叛。所以,博弈双方的最优理性战略都是背叛,纳什均衡结果是A2B2,这是一个帕累托无效的纳什均衡解。基欧汉对囚徒困境的理解颇为深刻:“在需要集体行动的状态中,合作对获得一种为所有相关成员共同享用的物品是必要的,不管这些成员是否为这种物品的供应作出贡献。当每一个成员为供应这种物品所承担的成本,与总的成本相比非常小的时候,利己的个体可能会作出估算,认为他们如果不作贡献的话会好一点,因为他们的贡献对自己来说是有成本的,而其贡献对这种物品最终被生产出来却只会产生微不足道的影响。因此就像在囚徒困境中一样,对一个利己主义者来说,占优势的战略是背叛而不是对这种物品的生产作出贡献”。
[6]
二、国际气候合作与非合作性博弈
全球气候变化问题上的国际合作,本质上就是集体行动是否可行以及如何实现的问题。国际气候合作要取得成功,首要问题就是实现个体理性与集体理性保持一致,避免出现集体理性失控现象。产权界定问题是全球公共物品共同面临的难题,全球气候变化问题也不例外。由于缺乏具体的产权界定,所有的国家为最大限度地获得经济利益,将滥用气候资源,不受限制地排放温室气体,从而最终导致哈丁所谓的“公用地的悲剧”。因此,要实现共同利益,各国需要一致同意合作以减少化石能源消耗。但是,合作协议是不稳定的,因为任何一个国家如果搭便车将获得更大利益。从这个角度来看,“囚徒困境”博弈最具有代表性。囚徒困境的创造本身就部分地奠定了非合作性博弈的理论基础,并且它可以作为实际生活中的许多现象的一个抽象概括。
[5]
囚徒困境说明的是
个体理性行为的总和导致集体非理性的反论问题。这是国际合作中存在的一个关键问题,即在以逐利原则为主导的个体行动组成的世界中,即使共同利益存在,个体往往也不会主动为这种共同利益去努力。从囚徒困境中我们可以得出一个很重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡。
[5]
美国
·基欧汉(RobertKeohane)在阐述新自由制度学者罗伯特
主义的相关理论时,也采用“囚徒困境”作为分析框架。基欧汉指出:“不是世界政治或者国际政治经济中的所有形势都可以采取囚徒困境的形式表现出来,但是大部分都是如此的,由囚徒困境所提出的问题对本书讨论的合作与纷争问题是关键性的”,而且“奥尔森(MancurOlson)阐述的集体行动的逻辑,本质上与囚徒困境的逻辑是一样的”。
[6]
在国际气候合作中,囚徒困境现象表现得最为明显和突出。在国际气候合作中,特别是在温室气体减排问题上,博弈双方的最优理性战略也都是背叛。如果每个国家都不受限制地排放温室气体,而且都认为,当他国不受限制地排放二氧化碳的同时,即使自己单方面限制排放,对延缓全球气候变化也不会产生根本性助益;或者每个国家都认为,在其他国家联合限制二氧化碳排放量的时候,自己单方面扩大二氧化碳的排放量不会对全球气候变化产生决定性影响时,最终必将重演全球的“公用地的悲剧”。在囚徒困境博弈情境下,博弈双方出于个体理性的最优选择都是不合作,所形成的纳什均衡解是典型的集体理性失控。在国际气候合作中出现这种局面则意味着应对气候变化的努力彻底失败,气候系统将趋于崩溃。所以,在国际气候合作中如何避免出现囚徒困境式博弈就成了合作成功与否的关键问题。美国对于京都机制就采取了囚徒困境博弈思维,强调如果发展中国家,特别是中国和印度等发展中大国不参与国际减排协议,即使美国采取减排行动也不会对全球温室气体减排产生根本性影响。同样,对于广大发展中国家来说,如果发达国家回避历史责任,坚持以发展中国家承诺量化
奥尔
[7]
森不赞成用囚徒困境解释集体行动的困境,认为它完全不适用小集团,但可以用来解释大集团集体行动的困境。
奥
尔森的理由是:“就大集团而言,其获得的任何集体物品的数量离最优水平越远,它就越不可能采取行动去获取哪怕是最小数量的这类物品。简而言之,集团越大,就越不能去增进它的共同利益”。的分析模式。
囚徒困境博弈描述的是这样一个情景:两个囚徒共同犯下一起严重罪行。如果两个囚徒都保持沉默,就难以取得他们犯罪的证据,在这种情况下,他们会被判较轻的刑罚,判入狱1年。如果他们其中一人坦白了,并提供另一个人犯罪的证据,那么坦白者就会被立即释放,而另一囚徒就会面临入狱30年的刑罚。如果两个囚徒都坦白并互相提供对方犯罪的证据,那么两个囚徒都会被判入狱15年,如图所示:
[8]
从奥尔森的申辩中可以看出,在解
释大集团的集体行动的困境时,囚徒困境可以用作代表性
-
97-
减排指标为达成减排协议的前提,发展中国家为了自身发展利益,也会在国际气候谈判中采取抵制态度,导致国际气候合作陷入僵局。
基础上,如果博弈方认为自己承担的成本不公平,极有可能在个体理性逐利动机的强烈驱使下退出博弈。
应对气候变化的责任承担问题是国际气候合作中各国制定气候政策的前提和基础,因此各国都把责任承担是否公平视作国际气候谈判的核心问题。在国际气候变化谈判中,成员之间承担的责任越公平,其对于合作的态度就越积极。[11]责任承担的公平性应该从国家的发展程度、国家具备的能力和个人发展权利三个方面给予保障。
三、超越“囚徒困境”博弈的几种可能途径
按照博弈论的解释,要解决囚徒困境有三种可能的途径:第一,博弈各方要建立相互信任关系。国家之间特别是发达国家与发展中国家之间应该建立良好的互信关系,保持信息沟通渠道畅通。发达国家应该遵循“共同但有区别的责任”原则,在温室气体减排方面率先采取行动,换取发展中国家的信任。发达国家应该切实履行自己的承诺,向发展中国家提供资金和技术援助,帮助其提高减缓和适应气候变化的能力。发展中国家要认真履行在《联合国气候变化框架公约》和《京都议定书》中承担的相应义务,表明参与国际气候合作的诚意,并在力所能及的基础上,按照自愿原则降低温室气体排放,待到能力达到一定程度后再考虑量化减排问题。发达国家之间也应该建立互信关系,尤其是欧美要放弃在气候问题上的争吵,在温室气体减排方面做出实际行动。第二,博弈各方签订有约束力的合约。基欧汉指出,国家为追求共同利益创立了国际机制。国家发现自己困在囚徒困境中,但由于国际机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。机制可以向国家提供信息或降低交易成本从而促进合作。国际社会一直致力于签订一项有约束力的国际协议,以“硬法”的形式对各国在应对气候变化行动中应承担的相关义务做出具体安排,形成有效的国际气候机制,以保证气候变化行动顺利进行。基欧汉指出:“总的来说,国际机制通过降低被欺骗的可能性,使合作成为更加明智的选择。……如同广义上定义的国际法一样,它们的功能就是要使人类行动符合可预测的模式,从而使预计的行动能够在手段和目的之间获得一种理性的关系中前进”。
[6][9]
1.从国家的发展程度看,要保证责任承担的公平性,就必须确定“共同但有区别的责任”原则。全球气候变化问题危及全人类的共同利益,每个国家在应对这一危机时都必须承担共同的责任。然而,无论是从历史排放还是从现实排放来看,发达国家都应对温室气体排放造成的全球气候变化承担主要责任。自工业革命以来,发达国家消耗的煤炭和石油产生的温室气体导致大气中二氧化碳含量上升了
60%。目前,发达国家人口仅占世界总人口的25%,却已经并仍在消耗着世界80%的能源,发达国家的二氧化碳排放量依然占到世界排放总量的75%。以人均排放为例,发达国家的人均排放量为3.12吨,而发展中国家的这一数字尚不及其九分之一。如果要发达国家和发展中国家均等地承担责任,势必严重违反可持续发展原则所大力倡导的公平原则。因此,国际气候合作必须遵循“共同但有区别的责任”原则。《联合国气候变化框架公约》中明确规定:“气候变化的全球性要求所有国家根据其共同但有区别的责任和各自的能力及其社会和经济条件,尽可能开展最广泛的合作,并参与有效和适当的国际应对行动。”《京都议定书》和“巴厘岛路线图”为保证在应对气候变化问题上体现真正的公平,对“共同但有区别的责任”原则再次给予了强调。根据这一原则的要求,发达国家有义务承诺硬性减排的量化指标并率先采取减排行动。同时,为保证国际气候合作的广泛参与性,发达国家必须向发展中国家提供充足的资金和先进的技术以提高其减缓和适应气候变化的能力。
第三,重复博弈在一定程度上能够起到缓解困境的效用。囚徒困境之所以出现集体行动的悖论,在很大程度上因
2.从国家具备的能力来看,公平的责任承担要求不同的国家在应对气候变化的国际合作中应该作出不同的贡献。发达国家对气候变化的脆弱性相对发展中国家要低,而且在资金和技术上都拥有更高的应对气候变化的能力。各国都肩负着恢复和维持气候系统以实现其可持续发展的共同责任,能力高的国家理应作出更大的贡献,这对能力较低的国家参与合作将产生示范和激励的作用。发达国家应该履行已经在《联合国气候变化框架公约》和《京都议定书》中作出的承诺,向发展中国家提供资金和技术支持,帮助发展中国家提高减缓和适应气候的能力。
为博弈是一次完成的,选择背叛的博弈者不用担心在下一轮博弈中遭受报复。然而,国际气候合作中的博弈却并非一次博弈,而是多次重复博弈。“重复囚徒困境”允许双方从合作中得到好处,同时也提供了一方占另一方便宜的或双方都不合作的可能。在这种情况下,每一方采取合作或背叛战略后都会在下一轮博弈中面临被对方奖励或惩罚,因此博弈方最佳选择都是“一报还一报”(TitforTat)策略,即模仿对方上一步的选择。先采取合作行动的一方相信自己的合作行为能换得对方的配合,否则将在下一轮博弈中惩罚对方。“一报还一报”的稳定成功的原因在于“它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作,它的清晰性使它容易被对方理解,从而引出长期的合作”。
[10]
3.从个人发展权利看,责任承担的公平性强调对于人均平等的保障。按照可持续发展理念的要求,每个人都有平等享用大气资源的权利,国际社会不能按照发展程度高低和贫富状况差异作为分配大气资源的基础。在全球气候变化问题上,发达国家主张温室气体减排必须全球参与,尤其是发展中大国如中国、印度等国家必须承担强制性减排份额,以此作为发达国家承担具体减排份额的前提条件。发展中国家强调,一国的排放权等于国家人口与世界人均排放
温室气体减排方面
就存在“重复囚徒困境”博弈,欧盟不断提出新的减排目标并承诺如果其他发达国家减排,欧盟还将扩大减排力度。需要指出的是,这三种可能途径必须建立在成本支出公平的
-
98-
权的乘积;国际气候谈判必须建立在人均能源消耗和人均温室气体排放的基础之上。如果单纯根据国家排放总量按比例减排,势必对发展中国家的发展造成严重伤害,威胁到其维系生存问题的温室气体排放。这种形式上的公平违背了可持续发展的公平原则,造成了个人发展权利实际上的不平等。如果发展中国家面临既无技术又无资金的双重困境,那么它们在国际气候合作的博弈中极易选择消极的政策甚至退出国际合作,从而导致国际气候合作失败。
[3]于宏源.国际环境合作中的集体行动的逻辑[J].世界经济与政治,2007,(5).
[4]崔大鹏.国际气候合作的政治经济学分析[M].北京:商务印书馆,2003.
[5]张维迎.博弈论与信息经济学[M].上海:三联书店和上海出版社,2002.
[6]〔美〕罗伯特·基欧汉.霸权之后———世界政治经济中的合作与纷争[M].上海:上海世纪出版集团,2006.
[7]高春芽.集体行动的逻辑及其困境[J].武汉理工大学学报,2008,
四、结语
应对全球气候变化的国际合作是解决气候危机的必然选择。在这一进程中,各国(国家集团)的个体利益与全人类的共同利益必然会发生激烈的碰撞,“囚徒困境”始终是困扰国际气候合作总体进展的障碍,其关键就在于如何在协调个体理性的基础上实现集体理性。在国际气候合作实践中,各国都应该正确地认识到,全人类的共同利益高于个体利益,当长期利益与短期利益、全人类利益与个体利益发生冲突时,必须通过理性选择,做出正确的决策。参考文献:
[1]王杰.国际机制论[M].北京:新华出版社,2002.
[2]〔美〕詹姆斯·多尔蒂,小罗伯特·普法尔茨格拉夫.争论中的国际关系理论[M].北京:世界知识出版社,2003.
(1).
[8]〔美〕曼瑟尔·奥尔森.集体行动的逻辑[M].上海:上海三联书店,
1995.
[9]陈宏.博弈论与战略互动[A].秦亚青.理性与国际合作:自由主义·国际关系理论研究[C].北京:世界知识出版社,2008;〔美〕莉萨马丁.利益、权力和多边主义[A].〔美〕莉萨·马丁,贝思·西蒙斯.国际制度[C].上海:上海世纪出版集团,2006.
[10]〔美〕罗伯特·阿克塞尔罗德.合作的进化[M].上海:上海世纪出版集团,2007.
[11]张海滨.中国在国际气候变化谈判中的立场:连续性与变化及其原因探析[J].世界经济与政治,2006,(10).
责任编辑
文
嵘
-
99-