中国社会科学杂志社

首页>中国社会科学报>科学与人文

演化博弈论带来社会行为研究新发展

2023年07月11日 09:59 来源：《中国社会科学报》2023年7月11日第2688期作者：张明君

　　合作、利他、惩罚、公平分配、发送信号……诸如此类的社会行为在人类及其他社会性动物中普遍存在，并在其群体结构的维持、发展和演化中发挥着重要作用。解释社会行为产生的原因，揭示其起源与演化的条件、机制和过程，是社会科学哲学的重要议题，对理解社会性的本质具有重要的理论和现实意义。传统的理性选择理论认为，社会行为的出现是人类在“自然状态”下基于理性推理能力进行选择的结果。然而，越来越多的研究发现，传统的理性选择理论不足以解释社会行为的起源。一方面，人类的很多社会行为违背了理性选择理论的某些基本原则；另一方面，社会行为并非人类所独有，一些通常被认为没有或仅具备较低理性思维能力的动物，也会表现出与人类类似的社会行为。与之相对，作为一种跨学科理论框架的演化博弈论（evolutionary game theory）在过去的20多年里蓬勃发展，为研究社会行为的起源与演化提供了极富潜力的新的理论工具。

　　起源与发展

　　演化博弈论的前身是经济学领域的博弈论（game theory），最初用于研究人的经济行为。博弈论的思想被引入演化生物学后，经过生物学家的改造与发展，逐渐形成了演化博弈论的理论体系。演化博弈论是社会科学理论迁移到生物学的成功案例，其发展成果近来又开始反哺人文社会科学领域的研究。

　　在经典博弈论中，一场博弈通常包含三个核心要素：博弈者（players）、策略（strategies）和收益（pay-off）。这些要素可以通过收益矩阵（pay-off matrix）的方式呈现。以博弈论中著名的博弈类型“囚徒困境”（prisoner’s dilemma）为例：假设两名犯罪嫌疑人被指控合伙犯下一起案件，并被关在不同的房间里审问。这两名囚徒就成为这场博弈的参与者（即博弈者）。他们每人都有两种策略可以选择：保持沉默或出卖同伙。该场景能够成为一场“博弈”的关键因素是：每位博弈者的收益不仅取决于自己采取的策略，还取决于对手的策略。当两人都保持沉默时，各自只被判入狱1年；当两个人都出卖对方时，两个人都被判入狱5年；当一个人保持沉默，而另一个人出卖对方时，保持沉默的人被判10年，而出卖同伙、提供情报的人则无罪释放。该博弈可以通过下表所示的收益矩阵来呈现。

　　“囚徒困境”博弈的收益矩阵

　　博弈论被引入演化生物学后，主要用于研究生物表型（phenotypes）的演化。与经典博弈论类似，演化博弈论中的“博弈”同样包含三个核心要素：博弈者、策略和收益。但与此同时，两种理论在以下三个方面表现出显著的差异性。

　　其一，在经典博弈中，博弈者被视为理性的行动者，博弈者采取何种策略取决于哪种策略能使自己的收益最大化。比如，在囚徒困境的博弈中，不论对方选择保持沉默还是出卖同伙，个体选择出卖同伙的收益都要高于保持沉默。因此，出于理性的考量，每个个体都会选择出卖同伙。但这样一来，每人都要被判五年，相比于两人都保持沉默反而是更差的结果——这也正是该博弈被称为“困境”的原因。而在演化博弈中，博弈者一般被视为没有或仅具备较低理性的个体（在一定的环境条件下，生物个体采取何种策略甚至可以完全由其基因型所决定）。

　　其二，在经典博弈中，博弈者的收益一般被理解为经济学意义上的效用（utility）。效用常用钱的多少来衡量，但也可以用博弈者所偏好的其他东西来衡量。比如，在囚徒博弈中，人身自由时间长度的变化量就可以用来衡量收益。而在演化博弈中，收益被理解为个体经过博弈之后适应度（fitness）的改变。在生物演化的背景下，适应度大致可以理解为生物生存下来并成功繁殖后代的能力，通常用后代数量的期望值来进行估计。

　　其三，经典博弈论主要用于预测或解释理性行动者在博弈场景下的策略选择。而演化博弈论主要研究的是，选取不同策略的个体之间的博弈如何影响这些策略在种群中的分布和演化。

　　演化博弈论源于经典博弈论，其应用范围后续也出现了从生物演化到文化演化的发展。演化博弈论最初用于研究自然界中生物性状的演化，而这些性状通常被认为是通过基因遗传在代际之间进行传递的。然而，当该理论被重新引入人文社会科学领域，用来研究人的社会行为的演化时，上述假设就不完全适用了。人类不但经历着生物意义上的演化，也经历着文化意义上的演化（当然，并不是只有人类社会才存在文化演化，如鸟类求偶时的复杂鸣叫、鲸类的集体捕猎等社会行为，可能也是通过文化遗传的方式传递给后代的）。虽然社会行为的出现需要一定基因的存在作为基础，但人类的很多社会行为本身并不是直接通过基因遗传的方式，而是通过学习和模仿等文化遗传的方式从他人那里习得的。正因如此，用于研究社会行为的演化博弈论模型，更多采用的是文化演化或文化演化与生物演化相结合的建模方式。

　　值得注意的是，在文化演化中，一个人学习和模仿的对象并不必然是自己生物学意义上的父母，还可以是自己的其他长辈、朋友甚至是陌生人。学习和模仿的策略也是多种多样的：一个人可能会选择模仿身边收益最高的人所采用的策略，可能会模仿周边出现频率最高的策略，还可能会模仿具有特定角色的人（如父母、老师或名人等）所采取的策略。这些不同的学习规则，会使文化演化呈现不同的动力学特征。

　　应用于社会行为研究

　　从演化博弈的视角来研究社会行为，最首要也是最基本的工作是构建不同类型的演化博弈论模型，以表明各种社会行为的涌现和维持在演化上何以可能。在这方面，一些科学哲学家已开展大量工作。下面将以公平分配以及语言和意义的演化这两个方向的研究为例，展示演化博弈论视角下社会行为研究开展的方式和取得的成果。

　　其一，公平分配。一些经济学家曾开展过这样一类实验：要求两名被试共同分掉一笔钱，并让他们各自在纸条上提前写下自己想要的百分比。如果百分比之和大于1，那么两人什么都得不到；如果百分比之和小于等于1，那么两人可以分别得到自己想要的份额。该研究发现，绝大部分被试都会选择索要50%或接近50%的份额。那么，如何解释这一现象？

　　一些演化博弈论研究者设想了这样一种场景：假设在一个种群中，个体之间两两随机配对，分别围绕着一份资源进行上述类型的博弈。每人索要的份额，可以理解为该个体在博弈中所采取的策略，而每种策略的平均收益则会影响到该策略在种群下一代中所占的比例。该研究发现，当该种群按照复制子动力学（replicator dynamics）的方式进行演化时，在大部分情况下，主张平均分配的个体会占据整个种群；但与此同时，也存在不少种群最终演化为多种非平均分配策略（如60%和40%）共存（即多态均衡）的情况。为解决这一问题，有研究者建议在策略的交互中加入正相关性，即个体与个体之间不是随机两两博弈，而是采用相同策略的个体之间有更大的概率发生博弈。这样一来，种群演化为多态均衡的情况就几乎消失了。还有研究者进一步将个体间的博弈空间化，即每个个体只与自己的邻居进行博弈，并且根据邻居和自身的收益情况来更新自己的策略（如模仿最成功的邻居所采取的策略），同样可以使种群几乎总是演化为所有人都平均分配的状态。这些模型虽然都非常理想化，但它们为研究公平分配的起源和演化提供了一种新的思路。

　　其二，语言和意义的演化。语言符号的一个重要特点是具有任意性，即语言符号的语音形式和意义之间往往没有自然属性上的必然联系，而是社会约定俗成的结果。比如，在汉语中，我们用“苹果”一词来表示苹果这种水果，但只要社会成员共同约定的话，“苹果”一词完全也可以用来表示桃子。如果语言是一种基于惯习（convention）而形成的交流系统的话，那么，那些最初的语言上的惯习是如何产生并维持的？

　　刘易斯（David Lewis）在《惯习》（Convention）一书中所提出的“发送者—接收者”信号博弈，为研究上述问题提供了一种重要的理论框架。在“发送者—接收者”信号博弈中，发送者可以感知周围世界所发生的事态并发出某种信号，而接收者可以根据收到的信号作出某种反应。如果接收者作出的反应与事态相匹配，那么发送者和接收者均可获得一定的收益；否则，两者收益均为零。

　　为方便讨论，可以考虑一场只有两人的信号博弈。其中，一人为发送者，另一人为接收者。假设只存在两种事态{S1, S2}，发送者只有{σ1, σ2}两种信号可以使用，接收者只能作出{r1, r2}两种反应，并且反应r1只与事态S1相匹配，反应r2只与事态S2相匹配。在这样的设置下，发送者有4种策略可以选择。发送者策略1：S1→σ1，S2→σ1；发送者策略2：S1→σ1，S2→σ2；发送者策略3：S1→σ2，S2→σ1；发送者策略4：S1→σ2，S2→σ2。接收者也有四种策略可以选择。接收者策略1：σ1→r1，σ2→r1；接收者策略2：σ1→r1，σ2→r2；接收者策略3：σ1→r2，σ2→r1；接收者策略4：σ1→r2，σ2→r2。只有两种策略组合可以实现反应与事态的完全匹配，从而形成信号系统。信号系统A：<发送者策略2，接收者策略2>；信号系统B：<发送者策略3，接收者策略3>。

　　以上的信号博弈只是发生在两个个体之间，并且每个人的角色是固定的。该研究发现，如果将信号博弈的框架与演化博弈论相结合，使一个种群中的个体既可以是发送者又可以是接收者，两两之间随机配对进行信号博弈，并按照复制子动力学的方式进行演化，那么种群将几乎总是趋向于演化出以上两种信号系统中的一种。这表明，在一定的条件下，种群中相互作用的个体可以自发学会发送信号，并演化出稳定的信号系统。

　　问题与展望

　　尽管针对社会行为的演化博弈建模工作硕果累累，但这一研究进路背后存在的一些方法论问题，尚未得到系统性解决和处理。这使得不少学者对基于演化博弈论的社会行为研究的可靠性和有效性产生了质疑。在这里仅简单介绍两种主要的批评。

　　其一，从“如何可能”的解释到“实际如何”的解释。同其他科学模型一样，演化博弈论模型的构建也要基于一定的假设。当演化博弈论模型用于解释人类社会行为的起源与演化时，相关假设包括人类早期社群的结构、文化遗传发生的机制、博弈发生的方式等。相比于骨骼结构等性状，与行为性状相关的信息极难保存。在大多数情况下，科学家只能通过间接的证据进行推测。正因如此，一些研究者认为，演化博弈论模型所提供的仅仅是“假设性的故事”（just-so stories）。这些模型确实提供了某种解释，但它仅仅是“如何可能”（how-possibly）的解释，即在模型所设定的条件下，某种社会行为是有可能产生并维持的。不过，这并不意味着人们现在所具有的社会行为确实是通过这些模型所展示的方式演化出来的。比如，在关于公平分配的案例中，人类早期的祖先真的进行过模型中所描述的那种博弈吗？如果演化博弈论模型中的关键假设不能得到有效的辩护和确证，那么它们所提供的解释就只是关于社会行为“如何可能”演化的解释，而不是“实际如何”演化的解释。

　　其二，对于规范性的解释。作为一种自然主义的研究进路，基于演化博弈论的社会行为研究也面临如何从“是”（is）推出“应该”（should）的问题。基切尔（Philip Kitcher）指出，现有的演化博弈论模型未能对我们借以评价社会行为的概念和原则等“上层建筑”作出解释。比如，在关于公平分配的演化博弈论模型中，虽然模型的设置使得种群几乎总是演化为所有人都平均分配的状态，但这并未解释这种分配方式在何种意义上是“公平的”，或者为什么认为这种分配方式是公平的。此外，当模型中的个体更新自己的分配策略时，他们基于的是邻居和自身的收益情况，而不是某种分配策略是否公平，这使得整个模型似乎与公平无关。演化博弈论模型如何能够为理解社会行为（特别是道德行为）所体现出的规范性特征提供洞见？这将是基于演化博弈论的社会行为研究未来必须考虑的问题。

　　如果承认人类社会是生物演化和文化演化共同作用的产物，那么我们便有理由相信，演化博弈论可以为理解社会行为的起源与演化提供有益的洞见。当然，这并不意味着当前的演化博弈论已经可以解决所有问题，也不意味着演化博弈论未来可以单独解决所有问题。社会行为所呈现的多样性和复杂性，要求我们必须突破传统的学科边界，实现不同领域（包括心理学、人类学、考古学、灵长类研究等学科）的理论资源和经验成果的整合——演化博弈论有潜力为这一综合提供基本的理论框架。

　　（作者单位：复旦大学哲学学院）

责任编辑：张晶

重点推荐