中国社会科学杂志社

首页>中国社会科学报>学术资讯>国际

利用博弈论解释非理性行为

2022年12月30日 09:27 来源：《中国社会科学报》2022年12月30日第2563期作者：本报记者王悠然

　　长期以来，“理性人”假设是经典经济学分析人类行为的基础，包括著名的博弈论。然而，行为经济学表明，许多人类行为似乎并不理性，这就为博弈论的可信性打上了一个问号。随着经济学研究的推进，在理性与非理性这两个人类行为的极点之间是否存在中间地带，这个中间地带是否可以更好地解释人类行为，迫切需要学界给出解答。最近，美国麻省理工学院斯隆管理学院应用合作团队主任、研究科学家埃雷兹·尤利（Erez Yoeli）和哈佛大学经济学系访问教师、麻省理工学院斯隆管理学院应用合作团队研究员摩谢·霍夫曼（Moshe Hoffman）找到了经典经济学“超理性”与行为经济学“超非理性”之间的中间地带，称之为“隐藏的博弈”。他们将相关研究和实践成果梳理总结为新著《隐藏的博弈：博弈论解释非理性人类行为的惊人力量》。本报记者围绕该书主题采访了两位学者。

　　《中国社会科学报》：《隐藏的博弈》的写作背景是什么？是什么启发您用博弈论解释各种非理性的想法、感觉和行为？

　　霍夫曼：故事要从我的高中时代说起。我生长于犹太教正统派社群，但在读了英国演化生物学家理查德·道金斯（Richard Dawkins）的书后脱离了犹太教。在道金斯的名作《自私的基因》中，我首次了解到博弈论，博弈论对一些怪异的动物行为有极强的解释力，这令我思考博弈论是否也能解释人类行为。我甚至询问高中辅导员，有没有可能在大学学习类似的内容。可惜，辅导员的回答是还不存在这样的领域。十年后，我依然没有放弃借助博弈论来更好地理解人类“怪癖”。当时我在美国另一所高校教授博弈论课程，尝试以新的方式应用博弈论，但由于条理混乱，教学效果不佳。

　　尤利：我在本科和研究生阶段都学习了博弈论，但在当时感觉有些无趣，而霍夫曼的新应用强烈吸引了我，于是我们进一步研发了霍夫曼的课程并将它“推销”给了麻省理工学院。从2013年起，我们一起教授这门课。

　　霍夫曼：我们汇编了一些经典的博弈论模型，并设计了一些新模型，作为课程内容的基础。我们在哈佛大学和波士顿学院也开设了这门课。每年我们都尝试加入新素材，并与学生们一起进行“测试”，以完善原有素材。现在，这些经验都汇总于《隐藏的博弈》。

　　演化助力最优策略达成

　　《中国社会科学报》：博弈论的理论渊源是什么？可否向非经济学专业的读者解释博弈论和“隐藏的博弈”？

　　霍夫曼：博弈论是现代数学的一个分支，它考虑游戏或赛局中个体的预测行为和实际行为，并研究他们的优化策略。博弈论的思想雏形可追溯至古代，古希腊哲学家柏拉图在《拉凯斯篇》和《会饮篇》中就描述过前线士兵如何抉择坚守还是后退的场景。1663年出版的意大利博学家吉罗拉莫·卡尔达诺（Gerolamo Cardano）的《关于机会的游戏》提出了博弈论的一些基本理念。

　　19—20世纪，法国哲学家和数学家安东尼·奥古斯丁·库尔诺（Antoine Augustin Cournot）、德国数学家恩斯特·策梅洛（Ernst Zermelo）、法国数学家和政治家埃米尔·博雷尔（?譩mile Borel）、匈牙利裔美籍数学家和计算机科学家约翰·冯·诺依曼（John von Neumann）等学者关于市场垄断、国际象棋、混合策略、极小极大定理等方面的研究，为现代博弈论奠定了基础。1944年，冯·诺依曼和德裔美籍经济学家奥斯卡·莫根施特恩（Oskar Morgenstern）合著的《博弈论与经济行为》一书出版，标志着博弈论作为一个独立领域正式诞生。

　　尤利：博弈论可能没有大家想象的那么高深，简单地讲，它涉及“三个部分”和“两个假设”。“三个部分”为：参与者或玩家、参与者选择的不同行动、收益。第一个假设是：收益取决于所有参与者而非某一名参与者选择的行动。第二个假设是：参与者都是以最优方式选择行动的。博弈论的核心价值就是处理各方动机相互交织的情况。

　　传统上，博弈论可用于研究企业、政治家、拍卖活动等。博弈论可以帮助人们分析各种问题，例如，监管机构是否应当允许企业合并，为什么小型核武器工厂可能比大型的更危险，为何拍卖行有时会毁掉无人竞拍的拍品，为什么有的人喜欢做手工、有的人喜欢钻研问题，动物为什么宣示领地。虽然动物不同于人类，不可能在会议室中与专业团队研讨策略，但生物演化助其作出最优决策。

　　人类优化策略的另一个途径是文化演进。文化可被视为人类在教学、模仿及其他社会传播形式中获得的、有能力影响个体行为的信息。演化论研究的是生物如何随着时间推移而发展变化。文化演进理论认为，文化变化（即信仰、知识、习俗、技能、态度、语言等的变化）与生物/基因演化在关键方面具有相似性。这有助于解释为什么某些地区的人喜欢辣味食物或对食物进行“碱化”处理，为何某些饮食禁忌被认为能避免孕妇吸收有毒物质等有趣的问题。我们的观点是，人类的口味/品位和信念大部分不是生物学层面上与生俱来的，而是习得的。

　　《隐藏的博弈》主要从生物演化和文化演进角度，解释了最优策略是如何实现的，这是博弈论的关键。我们用“隐藏”来形容博弈，是因为很多时候人们意识不到演化机制在起作用。例如，如果问人们为什么喜欢咸味、甜味、油腻的食物，回答可能只是“觉得味道好、吃起来开心”，但其实演化过程塑造着人的口味，盐、糖、油脂在人类的生存环境中曾长期属于稀缺品。又如，对称的面庞、轮廓分明的下巴、较宽的髋关节因“具有视觉美感”而受到青睐，但从演化角度看，这是因为人们寻求身体健康、生育力强的配偶。

　　“隐藏的博弈”形式多样

　　《中国社会科学报》：可否通过一些例证，具体解释“隐藏的博弈”理论？

　　霍夫曼：在世界某些地方，男性留长指甲十分常见，尤其是粉色的长指甲。如果问为什么，他们会说“这样好看”。但在其他地区的人看来，男性留长指甲恐怕并不吸引人。稍加调研我们就会知道，在过去，留长指甲的一般是从事室内工作、不需要耕种粮食的人，例如秘书、教师、政府官员。这些工作不会损伤指甲，且在本地社群中受人尊敬。因此，留长指甲的原因之一是它间接体现了一个人的职业和社会地位。

　　有些人在可以买到物美价廉的商品时依然选择购买奢侈品，这是一种“高成本信号”，即通过展示财富来增加自己的魅力，尽管这样做成本高昂。另一些人则走低调路线，例如，我们可能不知道身边共事已久的同事毕业于知名高校、出身于富裕家庭。反直觉的是，谦虚或许也是一种高成本信号。因为从长期来看，不炫耀可使自己更受他人喜爱。不显露财富释放的信号是自己拥有许多优点：我愿意隐藏一些关于自己的信息，我自信我拥有足够多的良好品质并可以被人发现；不提及我的优越条件是在表明我不需要用这些条件来给他人留下深刻印象，也不追求与看重这些条件的人进行肤浅的互动。

　　高成本信号理论源于以色列演化生物学家阿莫茨·扎哈维（Amotz Zahavi）1975年提出的“累赘原理”，后经英国牛津大学生物学教授艾伦·格拉芬（Alan Grafen）完善。根据该理论，高成本赋予了信号诚实可靠性，因为伪造冒充的成本过高。人和其他动物都会通过发出高成本信号来展示吸引他者的个人特征。例如，雄性孔雀的长尾巴对雌性孔雀具有吸引力。由于长尾巴会使孔雀更容易被捕杀，体格弱小的孔雀几乎不可能长出长尾巴，因此长尾巴意味着身体强健、更有能力躲避捕食者，长尾巴孔雀在性选择中更具优势。许多博弈论模型显示，经过学习和演化，上述状况将停留于纳什均衡：在不少于两名参与者的非合作博弈中，如果每名参与者都知道其他参与者的策略，且没有参与者可以通过单方面改变自己的策略而增加收益，即达到纳什均衡。

　　又如，一些高度党派化的政治新闻只呈现了片面的信息和言论，但仍拥有稳定的受众群。原因是其受众感兴趣的不是发现真相，而是发出群体成员身份的信号，或是说服他人认同自己的阵营是“好的一边”。当一个人相信倾向性报道时，就成为具有特定动机的推理者，说服他人的念头被内化，最终以隐蔽的方式影响着自己的信念。大部分人类行为是社会压力造就的：或是我的行为信号对他人产生的影响，或是他人通过正强化这些行为对我产生的影响。正强化指的是给予某一行为愉悦刺激/奖励后，该行为在相似环境下发生的概率增大。

　　尤利：“隐藏的博弈”可以揭示某些利他行为背后的真正动机，例如环保举动。人们大多相信这样做是为了保护环境，但在潜意识层面，也可能是因为这有利于自己的名誉。我在一项田野实验中发现，当某种无私行为的公开性上升时，更多的人就会参与进来。我建议工作人员将参加建筑物节能活动的人员名单张贴于大堂处，结果显示，相较于直接发送动员信，报名人数增加了。

　　霍夫曼：显著可见的善行能提升自己的公共信誉，树立正面的个人形象。对人类这样的高度社会性生物来说，个人形象至关重要。名誉好的人更受他人信任，可以形成更牢固的人际关系，达成更多合作。

　　尤利：博弈论还可以说明为何通过实施惩罚来执行社会规范要优于姑息不当行为。虽然惩罚本身亦有成本，但可以遏制不当行为被重复，进而降低成本。如果不实施惩罚，合作将失败，从此进入不合作环境。这对应博弈论中的子博弈完美纳什均衡概念：原博弈的每一个子博弈（原博弈的一部分，可作为独立的博弈来分析）都构成纳什均衡。它是纳什均衡在动态博弈中的精练，动态博弈指的是参与者的行动有时间先后顺序，且后行动者了解先行动者的选择。

　　以新思路运用经典理论

　　《中国社会科学报》：《隐藏的博弈》包含大量案例研究，您具体运用了哪些工具和方法来分析这些案例？

　　霍夫曼：我们仍采用传统博弈论来分析。该书收录了一些经典模型，例如高成本信号、鹰鸽博弈、重复囚徒困境。鹰鸽博弈是英国演化生物学家约翰·梅纳德·史密斯（John Maynard Smith）和美国群体遗传学家乔治·罗伯特·普莱斯（George Robert Price）在1973年提出的，它描述了生物个体竞争资源时可能采取的策略。鹰鸽博弈揭示了演化稳定策略，被视作演化博弈论（数学博弈论在生物学中的应用）正式诞生的标志。重复囚徒困境指的是相同的参与者多次重复经典囚徒困境，两者的区别在于：单次博弈中，参与者仅关心一次性收益，对每名参与者个人而言，最优策略都是背叛而非合作；多次博弈中，参与者会考虑长远收益，且有机会惩罚对方在前一回合中的背叛，合作因而有可能出现。《隐藏的博弈》也介绍了一些最新的行为研究模型，但依然使用纳什均衡等标准工具来分析。

　　尤利：对于很多初看起来非理性的事情，如果更深一步挖掘、提出正确的问题，困惑感就会明显减少。博弈论不过是分析此类情景的数学工具：对我而言正确的行动取决于对你而言的正确行动，反之亦然。我们使用的各种模型都具备这一特征。《隐藏的博弈》的新颖之处在于解读视角：当人们有意识地计算最优策略时，结果时常不佳且未被坚持贯彻；相反，生物演化和社会学习塑造着人们的直觉、习惯、价值观、启发法。启发法指的是人脑在不掌握全部相关信息时，为快速决策、判断、解决问题而使用的心理捷径。社会学习理论认为，社会行为是通过观察和模仿他人习得的。人类演化出了品位、信念、意识形态、直觉，来帮助自己进行涉及名誉、信号、群体身份、说服或其他事物的博弈。在这一视角下，我们得以运用经典经济学和博弈论工具来破解行为谜题。

　　超越传统“理性”概念

　　《中国社会科学报》：专业经济学家对“理性”的定义是否异于普通人？如何理解经典经济学的“超理性”与行为经济学的“超非理性”？

　　尤利：宽泛地说，理性指的是运用逻辑思维、根据知识得出结论的能力。专业经济学家通常将理性定义为对个人利益最优化的追求，但什么算作个人利益经常是不明晰的。经济学家所说的个人利益有时仅指物质利益，有时指一切使人愉快的事物。人们对理性的定义可能取决于语境，但大多数人会同意这一点：当一个人的行为缺乏一致性，或者所做之事并不能使自己愉快、对自己没有助益时，这会令他人费解。经济学家和普通人还会在另一个意义上谈论理性：如果某一观念与关于世界的基本事实不符，那么它是非理性的。因此，相信神的存在或否定气候变化会被一些人视为非理性。

　　经典经济学包括经典博弈论，以人类擅长优化为前提：人们在面对新信息时，能够运用贝叶斯定理来更新认知，能够计算行动的预期收益并作出相应选择，既能解出复杂的方程，也没有自控力问题，还能注意到所有相关信息。也就是说，经典经济学假设人们知道最佳做法是什么且会这样做。显然，很多时候人们并未如此行事，而行为经济学可以解释非理性行为。

　　例如，人们会出于利他之心向慈善机构捐款，但如果人们善于优化，那么最优选择是捐款给工作效果最佳的慈善机构。事实上，人们在捐款前并不会考察慈善机构的工作效果。这个问题的关键在于，利他之心至少在一定程度上是由奖励和惩罚激发的。然而，对什么行为应予以奖励、对什么行为应施以惩罚，社会成员未必意见相同。向慈善机构捐款值得赞扬，在这一点上取得共识不难；而一家慈善机构的工作效果如何，不同的人则有不同的评判。因此，人们倾向于赞扬慈善捐款这一行为，但无法真正奖励“更有效的”捐款。

　　继续推进博弈论的发展

　　《中国社会科学报》：在美国，博弈论是否广泛应用于政策制定和机构决策？收效如何？您对推动博弈论的研究和应用以改善政策制定和实践有何建议？

　　霍夫曼：冷战时期，美苏两国采取了“相互确保摧毁”的军事战略。核力量相当的国家之间，如果一方发起核攻击，另一方会以对等或更强的力量反击，致使冲突升级，最终双方共同毁灭。这相当于一种纳什均衡，双方都没有发动攻击的激励因素。

　　另一类知名案例是无线电频谱拍卖。美国联邦通信委员会从1994年开始，以公开竞价的方式将部分频段的使用许可授予出价最高的竞买人。拍卖是博弈论的典型实际应用场景之一，拍卖人、竞买人之间有着复杂的博弈关系。美国经济学家、博弈论专家保罗·R. 米尔格罗姆（Paul R. Milgrom）和罗伯特·B. 威尔逊（Robert B. Wilson）因改进拍卖理论、发明新的拍卖形式而获得2020年诺贝尔经济学奖。他们在联邦通信委员会的无线电频谱拍卖机制设计中作出了突出贡献，此次获奖也被誉为博弈论的又一次胜利。

　　至于博弈论的应用表现，可能存在争议。在我们看来，博弈论在无线电频谱拍卖中的应用收效良好。不过，美国联邦贸易委员会的博弈论模型曾预测，医院合并后医疗费用不会上涨，但事实是合并后医疗费用上涨了。

　　博弈论在促进利他主义方面为使世界变得更好提供了重要指引，我们在新书关于规范执行的一章中详细探讨了这个话题。尤利在麻省理工学院的研究工作中也将这些见解应用于旨在鼓励慈善捐款、能源和水资源保护、服药依从性（患者正确遵医嘱服药的程度）等的干预措施设计中。

责任编辑：崔岑

重点推荐