天地人和 经世致用
Harmony Knowledge Solutions

12月13日,美国经济学家托马斯·克罗姆比·谢林逝世。他曾因为“通过博弈论分析改进了我们对冲突和合作的理解”与罗伯特·奥曼共同获得2005年诺贝尔经济学奖。
在其经典著作《冲突的战略》一书中,谢林首次定义并阐明了威慑、强制性威胁与承诺、战略移动等概念开始把关于博弈论的洞察力作为一个统一的分析框架来研究社会科学问题。
此文是盘古智库学术委员、印度研究中心主任林民旺教授2014年发表在《中国图书评论》上的一篇文章,文章对谢林先生《冲突的战略》一书及其学术影响做了深入分析与客观评价。
特刊发此文,以示缅怀!
林民旺盘古智库学术委员、印度研究中心主任
复旦大学国际问题研究院青年研究员
2005年10月10日,瑞典皇家科学院宣布,将2005年的诺贝尔经济学奖颁给托马斯·谢林和罗伯特·奥曼,以表彰他们“通过博弈论的分析,促进了人们对冲突和合作的理解”。《冲突的战略》是谢林获得诺贝尔经济学奖的主要原因。他也是研究国际问题的学者中第一个获得诺贝尔经济学奖的。1谢林生前曾是马里兰大学经济学系和公共政策学院教授,同时还被选为美国科学院、美国艺术与科学院的院士。谢林于1921年出生在加利福尼亚的奥克兰,1943年大学毕业于加州大学伯克利分校(University of California Berkeley)的经济学专业,1951年获得了哈佛大学的经济学博士学位。在此期间,1948-1953年谢林参加了美国政府重建欧洲的马歇尔计划,负责与欧洲国家谈判美国的经济及军事援助事项。正是这段工作经历,使得1953年回到耶鲁大学经济系任教的谢林开始将谈判作为自己的研究兴趣。2而1957年暑期,谢林到兰德公司总部的短期研究使得他对军事战略研究的兴趣越来越浓。1958-1959年他到兰德进行了军备控制与安全战略的研究。《冲突的战略》的主要思想就是在这一时期形成的。
谢林的著作所涉及的议题颇为广泛,然而,他的每项研究都产生了重要的影响。其中,最有影响力的是《冲突的战略》、《军备及其影响》、《微观动机与宏观行为》。《冲突的战略》采用讨价还价理论作为统一的分析框架,主要分析了国际关系中的冲突与合作问题。《军备控制及其影响》则是对前书的进一步深化,主要是将《冲突的战略》的思想应用到军备控制、威慑、核危机的研究中。《微观动机与宏观行为》更是成为了社会科学中采用基于智能体建模(Agent-Based Model)的研究方法的经典之作。
基本思想
《冲突的战略》首先批评了过去国际战略研究的落后。基于对国际冲突的零和博弈的理解,过去的研究不仅人为地缩小了研究结论的适用范围,也扭曲了客观的现实。谢林认为,双方利益完全对立的冲突状态是非常罕见的,冲突的双方并非完全势不两立的敌人,它们之间除了冲突利益往往还存在某种共同利益。换言之,它们之间的博弈不是“零和博弈”,而是“非零和博弈”,或者按照谢林的说法是“混合动机博弈(mixed-motive game)。亦即,冲突双方存在协调合作来获取共同利益的可能性,与此同时,它们之间还存在收益分配上的分歧。由于大多数的冲突都是基于对对方行为的预期而采取相互依赖的决策,因而双方都存在讨价还价的可能性,谢林认为讨价还价理论(bargaining theory)可以很好地用于这一研究中。
《冲突的战略》关注的是如何能够在这样的混合动机博弈中寻求一个双赢的结果,作出对双方互利的安排,并且如何能够使其中一方获得收益分配上的优势。谢林认为,只有通过武力的潜在使用而非武力的直接使用才能算得上是一种“冲突的战略”。由于威慑是通过警告对手,只有避免某些行动才能免遭惩罚,因而它就是这种战略的一种形式。然而,虽然威慑在日常生活中普遍存在,人们也经常使用这一战略,但是学术界却没有据此建立起一个完整的理论体系。
在这一批评的基础上,谢林提出,“冲突的战略”理论主张运用威胁(threat),或者威胁(threat)与允诺(promise)并用的方式去影响对手的行为选择。战略理论应该研究的内容包括:如何实现双赢的结果?如何能够更好地发挥威慑战略的作用,不使用武力却能够达到武力直接使用才实现的结果?如何在威慑中传递信息?如何能够实现威慑的可信度?国家如何能够利用经济、军事与其他的优势在战略性的讨价还价中实现更好的结果?等等。
谢林认为,在零和博弈中,采取模糊战略是必要的,以使对手猜测你的行为。而在非零和博弈中,采取一个更加透明的战略则是有益的。因为这种混合动机的博弈属于非确定的情势结构(indeterminate situations),博弈双方都存在着多种策略选择,这样就容易因利益分配的冲突而导致无法达成理想的结果。因此,博弈过程中关键是采取讨价还价的策略来实现确定的双赢结果。同时也为了获得讨价还价结果中的优势,谢林认为可以通过限制自我的选择权来达到限制对手的权力。换言之,谈判实力来自于自我约束的实力,而限制对手的能力取决于束缚自己的能力。
举例来说,在国际谈判中,由于存在着很大的谈判空间,谈判主体的讨价还价也会产生不同的结果。在谈判正式开始之前,谈判人员总是设法发表各种声明制造气氛,强调自己的坚定立场,从而激起民意,为自己在谈判中创造有利条件。一旦这种造势活动成功并将某种信息传达给谈判对手,那么,最初的谈判立场似乎看起来更像是最终结果。3所有承诺策略的本质在于,采取一些自愿而无法撤消的牺牲行动自由的行为。束缚你的行动自由是你谈判实力的一部分重要来源。同样,谢林还详细地介绍了其他几种增强谈判实力的措施,如通过谈判代表的授权限度来迫使对方接受自己的要价;进行交叉谈判或连续谈判的一方可以利用这种结构因素迫使对手相信自己让步的困难性;根据需要将谈判议程进行分离或者捆绑等。4
谢林同时讨论了如何在讨价还价中采用威胁和允诺的策略来实现双赢的结果。而这些策略的使用中最关键的是可信度的问题。例如,对于微弱的侵犯而言,大规模报复这样的威胁就是缺乏可信度的。由于威胁行为本身的显著特征就是威胁主体从未有付诸行动的决心和意志,因此,要实现威胁的可信度,除了束缚自己的行为选择之外,还可以假装自己错误地估计了实施威胁的后果,或者假装自己是一个易于冲动非理性的人(亦即所谓的疯子理论),或者还可以把声誉因素与威胁捆绑在一起等等。对于允诺的可信度,谢林认为可以采取化整为零的策略来逐步培养出互信。例如,假设两方约定,只有对方捐款100万,自己也会捐款100万。如果双方缺乏互信的话,则会阻碍承诺的履行。那么,通过采取分阶段的方式,可以解决这一问题。因为一方可以通过观察对方每次履约情况来评价其信誉。这样的策略可以大大地降低博弈初期的风险,逐步培养出互信。5
博弈中的战略稳定
除了分析讨价还价中的策略选择,《冲突的战略》一书着重探讨的另一个问题就是如何能够在冲突中发现聚焦点(focus point)并实现战略协调。6在缺乏沟通的情况下,双方为什么常常能够为实现共同利益来协调彼此的行为,达成合作的结果呢?例如,假设一对夫妇在拥挤的百货商场失散,他们不仅无法互相沟通,并且事先也没有约定见面的地点,然而他们还是可能找到对方。因为他们都会选择双方都知道的醒目的地方去等待对方,这样总比盲目地在商场内寻找更加容易。7而这个醒目的地方就是博弈的聚焦点。具有此类性质的博弈就属于默式谈判,诸如朝鲜战争这样的有限战争就是默式谈判。双方无法进行直接的沟通,同时却存在避免战争扩大化的结局,这样就选择了三八线作为双方对峙的界限。因而,三八线就是这场博弈中的聚焦点。
聚焦点也常常称作为谢林点(Schelling point)。谢林认为,博弈中能否找到问题的最佳解决方法或是任意一种解决方法(聚集点)很大程度上取决于双方的直觉而非逻辑思维推理,或许依靠来自双方对相似事物之间的类比经验、先例、偶然巧遇、对称性、审美观或几何原理、诡辩推理,以及当事人的自身条件和对彼此情况的了解。一般而言,聚焦点都具有一个非常显著的共同特点,即这些线索或关键点都具有某种显著特征,易于发现。同时,还可能是具有独特性和唯一性。8
在混合动机的博弈中,如果博弈双方的预期能够聚集在一点上,那么这一聚焦点本身就使得博弈形成了一个稳定的结果。在这些研究的基础上,谢林自然而然地进入另一个相关的问题,即关于核战略稳定的研究。
冷战之初,基于美国的核优势,艾森豪威尔政府推行了“大规模报复战略”。然而,随着1957年苏联发射了人类历史上第一颗人造地球卫星,并且成功地试射了一枚洲际弹道导弹之后,美国的安全“脆弱性”得到了大肆的渲染,而“大规模报复战略”也不再可行。战略家需要为美国制定一个新的核战略。由于美苏核能力的对等,这样就形成了平衡的恐怖(balance of terror)。问题是,这样的状况是最不稳定的,双方都可能基于担忧而发动先发制人的核打击,摧毁对方的核能力。
谢林通过举例来说明进行先发制人的核突袭的问题。某天晚上,我听到楼下有动静,就拿起枪下楼去看看。结果,我和一个正在作案的小偷正面相遇,而且对方手里也有一支枪。这样,我们就面临着一个双方都不愿意看到的场面。尽管双方都希望对方静静地走开,但是存在一个危险:对方认为我会开枪而首先开枪。更严重的情况是对方可能认为我认为对方可能开枪,或者对方可能认为我认为对方认为我想开枪。
美苏之间的核均势造成的情况就如同上面的例子。怎样才能消除对方主动进行突袭的动机?如何消除对方基于对我方首先发动突袭的担心而发动突袭呢?谢林认为,最重要的是如果突袭成功带来的收益远远小于战争成本,那么双方就都不存在发动突然袭击的根本动机。换言之,如果双方都能够在经历核打击之后,仍然保留足够的报复能力,那么将会削弱双方采取先发制人的核打击的动机,也可以避免对对方采取突袭的担心。因此,核战略中发展“第二次打击能力”至关重要。而此后,美国政府就一直坚持了“确保相互摧毁”的核战略。因为这一核战略能够使美苏形成战略稳定,双方都没有突袭的动机和担忧。
另一方面,正如电影《奇爱博士》中的一样,为了保持对苏联可信的核威慑,美国的核战略中需要如此设计:当苏联对美国进行核打击时,可以直接启动核报复,而无须经由领导人进行决策。但是,这样也存在一个问题,如果苏联一方由于偶然或者意外而向美国发射出的核武器,那么美国自动进行报复。这样,核战争将毁灭整个世界。谢林对于核战略的思考中,同样考虑到这一问题。很早就建议要在美苏领导人之间建立“热线”。
在裁军问题上,谢林认为,裁军本身是无法防止突袭的,战略的稳定才是根本。同样,只有那些能够导致战略稳定的裁军才是可行的。
贡献与批判
《冲突的战略》为核时代里的美国提供了应对苏联的战略,谢林的很多战略思想后来都成为了美国的战略,尤其是美国在越南采取的“战争边缘政策”和“有限战争政策”。而美国在越南的失败,也导致了不少人对谢林的思想提出了猛烈的批判。例如,理查德·内德·莱博就批判到,谢林遵从了理性的逻辑,却忽视了经验上的可能性。他虽然具备经济学家严谨的逻辑能力,但是却缺乏历史学家的感觉,他忽视了文化、历史等社会因素的作用。这也是他设计的对越政策失败的原因所在。9
然而,对于理性选择的分析,其实谢林自己也看到了不足,他认为“对理性行为的假设卓有成效。这种研究方法能够一针见血地揭露研究对象的关键所在,从而有助于理论发展。此外,这种方法能够使我们严格区分自己分析的冲突过程和假设中冲突主体参与的冲突过程。10而博弈论有助于人们将国际政治问题公式化以及对相关概念的诠释。11因此,他认为,理性假设只是我们分析的基点,并不是一个充足的理论。任何的思考,还是要基于复杂的情势。而这也正是他批评数理博弈的原因。
无论如何,谢林无疑是20世纪最杰出的社会科学家之一。他的思想产生了广泛的影响,引导了现在的很多研究及方法。如他的学生2001年诺贝尔经济学奖得主迈克尔·斯宾塞(Michael Spence)的信号传递模型就是受到谢林的启发,而著名的经济学家阿维纳什·迪克西特(Avinash Dixit)和理查德·济科豪瑟(Richard Zeckhauser)都坦诚,当年作为学生深受谢林的影响。谢林给我们最重要的启发是,对生活的好奇才是所有思想的来源。对他而言,对苏联的外交战略就如同教育小孩一样,生活的本质都是共通的。■
注释
1很多人称谢林是经济学家或者国际关系学家,其实这些说法都不太准确。谢林的研究涉及社会科学的各个领域,涵盖经济学、政治学(国际关系)、心理学、社会学等学科。尽管早期他受过良好的经济学训练,但是从20世纪50年代中期开始,他的研究兴趣转向了国际安全与美国核战略。
2Jean-Paul Carvalho, An Interview with Thomas Schelling, Oxonomics 2 (2007), P.1.
3 [美] 托马斯·谢林:《冲突的战略》(郑华等译),华夏出版社,2011年版,第25页。
4 Thomas Schelling, The Strategy of Conflict (Cambridge: Harvard University Press, 1980), PP.28-35.
5 [美] 托马斯·谢林:《冲突的战略》,第40页。
6 陈宏:《博弈论与战略互动》,载于《外交评论》2007年第2期,第101页。
7[美] 托马斯·谢林:《冲突的战略》,第48页。
8 [美] 托马斯·谢林:《冲突的战略》,第51页。
9 Richard Ned Lebow, Coercion, Cooperation, and Ethics in International Relations (New York: Routledge, 2007), pp.255-276.
10 [美] 托马斯·谢林:《冲突的战略》,第4页。
11 [美] 托马斯·谢林:《冲突的战略》,第9页。
林民旺
盘古智库学术委员、印度研究中心主任,复旦大学国际问题研究院青年研究员、南京大学中国南海研究协同创新中心研究员。主要研究领域为国际关系理论、国际安全与国际战略、中国外交与南亚问题等。曾在《世界经济与政治》《外交评论》《美国研究》《国际政治科学》《国际问题研究》《国际论坛》等期刊发表论文多篇。译有《战略经济学》《重获企业精神》《中国大战略与国际安全》《第二世界》等。

4001102288 欢迎批评指正
All Rights Reserved 新浪公司 版权所有
