[美国]卢卡斯·伦奇勒(Lucas Rentschler)、 [美国]克里斯多夫·达维(Christopher J. Dawe)/文 杨蓝岚/译
大数据和人工智能的出现改变了我们理解人类行为的方式。借助前所未有的海量数据集和强大的计算工具,研究人员可以识别出几十年前不可能检测到的模式。与此同时,这场技术革命导致一些人质疑传统理论框架在社会科学中的作用。当我们可以处理数百万个数据点并生成高度准确的预测时,为什么还要依赖简化的模型呢?这个问题触及了现代社会科学面临的一个基本矛盾:如何看待理论阐释和经验预测之间的关系。虽然大数据和机器学习在模式识别方面取得了显著的成功,但最近的研究表明,当面对新的情境或从未出现的情况时,其有效性可能会受到限制。在这种情况下,我们有必要重新探讨理论框架在算法决策时代的作用。
事实上,尽管大数据分析正在兴起,但理论框架仍然至关重要。经济学、心理学和决策科学的最新研究向我们展示了在新环境下进行预测行为时,简化的理论模型通常优于复杂的数据驱动方法。通过分析过度拟合现象,可以得知为什么简化的、基于理论的模型经常表现出优越的“迁移学习”能力,即在新情境下展现出同样良好的预测能力。对这个问题的探讨具有多重意义:对于学术界来说,有助于提出模型开发的新方法;对于政策领域、商业或社会活动来说,为何时依赖理论见解与何时依赖数据驱动的预测提供了指导;更广泛地说,有助于我们最大程度地利用人类智慧和机器智能来理解社会行为。
对传统模型提出质疑
想象一下教别人做饭。你可以给他们一套精确且详细的食谱,说明具体搅拌的时间、每种配料的确切用量,以及每片食材的精确厚度等。如果具备足够的细节,他们可能会完美地复制你的菜肴。但他们能理解烹饪中的原理吗?当面对不同的食材或不同的厨房时,他们知道该怎么做吗?或者,你可以教他们烹饪的基本原理,温度如何影响不同的食物,味道如何糅合,以及如何平衡口感。但在这个过程中也会出现很多错误。
这个烹饪的类比抓住了当今社会科学家面临的一个痛点。现代计算机使我们能够建立复杂的模型,以捕捉人类行为的微妙变化。这些模型擅长基于以往的数据进行预测,但面对新环境时往往会失效。这个问题在人工智能和机器学习领域尤其如此。这些新的工具发现了人类可能忽略的模式,对传统经济理论提出了质疑,所以很多人会提出疑问,当人工智能可以精确分析大量数据集时,为什么要使用那些传统的理论简化模型?最近的一些研究向我们揭示了这个问题的答案。虽然人工智能擅长熟悉的场景,正如已知菜肴的详细食谱,但简化的经济理论可以更好地预测新环境下的行为。就像基本的烹饪原理一样,它们捕捉到了在各种情况下都适用的基本模式。
因此,这又引发出了一个新问题,我们应该如何平衡人类行为模型的简单性和复杂性?这个问题的答案不仅关乎学术知识,对政策决策、商业战略以及更好地了解人类自身也很重要。
没有完美的模型
就像“金发姑娘”在太烫、太凉或刚刚好的粥之间做出选择一样,社会科学家在模型和理论方面也面临着类似的挑战。以保险决策为例,如果说基于价格和风险的纯理性选择的基本模型过于简单的话,那么一个综合了个性、天气、社交媒体、情绪等所有因素的复杂模型,就像太烫的粥一样让人难以承受,也就失去了作用。这个例子向我们展现了“过度拟合”的现象。假设一位老师在分析学生的表现时收集了大量的数据:学习时间、睡眠模式、早餐选择、鞋码、最喜欢的颜色等。这位老师的分析可能表明,穿蓝色衣服和吃燕麦片的学生在考试中得分更高。虽然这种模式非常适合现在的班级,但并不能预测明年新班级里同学们的表现。蓝色衣服、燕麦片和考试成绩之间的联系反映的是随机的巧合,并没有构成真实有效的关系。
这也是对人类行为建模的关键地方。我们的目标不是创建一个完美的模型来解释当前数据中的每一个决定。相反,我们想要确定足够基础的模式,以适用于不同的情况和人群。我们需要找到核心原则帮助我们理解在熟悉环境和新环境下的行为,比如人们如何对激励作出反应,或者人们如何权衡风险和回报。回到保险的例子,理论上最优的模型应该关注几个关键参数:个体的风险厌恶程度、对近期经验的偏好以及对价格的敏感性。虽然这样的模型不能涵盖购买保险行为的所有维度,但可以囊括足够的基本心理机制,以进行跨保险类别、期限和人群的可靠性预测。如何使模型更好地平衡复杂性和概括性的关系,构成了现代社会科学的一个核心挑战。事实证明,这种平衡对于理解传统经济理论在机器学习和算法时代的角色与作用至关重要。
简化模型与人工智能模型的类比
迁移学习是指如何将一种背景下的知识应用到另一种背景。通过研究意大利杂货店购物者而建立的消费者行为模型能否帮助我们理解北京市民的购物模式?基于金融投资研究的风险承担理论能否帮助我们预测人们如何选择不同的医疗手段?一个模型在不同情况下保持其预测力的能力,或许是对它的终极考验。
近来,美国研究人员将传统经济理论与人工智能模型进行了比较研究,发表了名为《经济模型的迁移表现》的论文。研究人员采用的第一种方法是使用基于风险和回报基本原则的简化模型。第二种方法则采用复杂的算法,类似于Netflix推荐电影或亚马逊预测购物行为的算法。在预测同一群体的行为时,人工智能的表现优于简化模型。然而,当应用于新的群体时,简化的经济模型被证明更可靠。亚马逊的推荐算法可能对美国购物者非常有效,但对完全不同市场的顾客却不太奏效。这是因为人工智能模型擅长在特定群体中找到具体的模式,但这些模式往往不能泛化。就像Netflix可能会注意到你在看惊悚片之后才看纪录片,这些精确但狭隘的见解并不一定可以推而广之。基于风险和回报基本原则的简化模型则捕捉到了更普遍的行为。
相比之下,传统经济模型关注的是人类心理的基本方面,比如大多数人更喜欢确定的收益,而不是具有相同预期价值的风险收益,或者损失可能大于潜在收益的情况。这些原则虽然没有关注到某一特定群体行为的所有细微差别,但被证明是更普遍适用的。这种模式在社会科学研究中非常常见。捕捉人类基本倾向的简化模型,包括人们对激励的反应、社会本能、认知偏见等,在跨环境中的表现往往比在单一环境中实现高精度的复杂模型更有效。正如语言学习一样,记住数千个外语短语的人可能会在其熟悉的环境下进行完美地沟通。但是,学习了基本语法规则的人,虽然一开始不太流利,但可能会更好地适应新的对话。同样,能够捕捉人类行为基本模式的简化模型往往比能够在特定情况下实现完美预测的复杂模型更有价值。
不同模型具有不同优势
想象一下,在你面前有两种选择:保证可以获得50元;或者通过投掷硬币来决定,如果是正面将赢得100元,反面则将一无所获。你将如何决定?在安全的选择和冒险的赌博之间作出选择,这个看似简单的场景经济学家已经研究了几十年。传统的经济理论提出了一些关于人们如何进行抉择的基本原则。经济学家认为,一个原因是大多数人都是“风险厌恶者”,人们通常更喜欢确定的事情,而不是平均回报相同的冒险赌注。另一个原因是,人们对损失的痛苦感受往往比获得同等收益的快乐更强烈。经济学家用相对简化的数学模型就可以得出这些结论。
在人工智能时代,机器学习算法可以分析大量关于人们选择的数据集,发现可能逃过人类注意的微妙模式。只要有足够多的关于人们如何在不同的赌博中作出选择的数据,这些算法就可以作出非常准确的预测。《经济模型的迁移表现》将两种方法进行了比较,研究人员收集了来自不同国家和背景的44组不同人群的数据,这些人群都对冒险赌博做出了选择。然后,研究人员比较了传统经济理论与复杂的机器学习算法两种不同方法预测选择的效果。研究结果显示,当预测某个群体的选择时,例如基于该群体的半数决策来预测他们的其他选择,人工智能系统通常会获胜。人工智能更善于抓取某个群体如何做出决定的特定模式。然而,当预测一个全新群体的行为时,传统的经济理论被证明更为可靠。事实证明,与人工智能的复杂模式相比,有关风险厌恶和损失敏感性的简化模型更能指导人类在新环境下的行为。
人工智能模型可以类比为当地人,他们知道家乡的每一条捷径和小巷,但在一个新的城市可能会迷路。经济理论更像是对城市的典型组织方式有一个基本的了解,虽然不太详细,但更普遍适用。这一发现具有深远的意义,在现实世界中,我们经常需要预测新环境下的行为:在一个城市有效的政策在另一个城市将如何运作?消费者对一个全新的产品会有什么反应?在这种情况下,掌握人类行为的基本原则,即使是简化的原则都可能比过去不同情况提供的详细数据更有价值。并不是说传统经济模型天生就更善于预测,它们只是更善于捕捉在不同环境中都适用的基本模式。当面对全新的情况时,这些基本的模型被证明比人工智能的复杂模型更可靠。
理论与数据的有机结合
探讨这个问题的目的并不是要在经济理论和机器学习之间引起竞争,重点在于如何将两者更好地结合起来。正如地理知识有助于解释GPS方向一样,经济理论有助于理解数据模式。以网上购物推荐为例,机器学习可能会发现,购买烹饪锅的顾客也会购买香料。但是,加入有关家庭规划的经济理论,不仅有助于预测消费者将购买什么,还有助于预测其何时购买。理论可以帮助构建数据模型,而数据也能更好地完善理论。例如,数据显示,在投资中避免风险的人可能仍会在赌博中寻求风险,这为风险规避的经济模型增添了细微差别。二者的结合在面对新情况时显得尤为重要。经济理论可以告诉我们,过去数据中的哪些模式可能适用于新的环境,哪些模式可能会发生变化。虽然具体的购物习惯可能因文化而异,但关于人们如何对价格和便利作出反应的基本原则往往在任何地方都适用。
一些研究人员已经在尝试将经济理论与机器学习结合起来,促进二者相互进步。人类智慧与人工智能都很关键,没有数据的理论是盲目的,没有理论的数据是混乱的。为了应对气候变化、不平等等一系列复杂的全球性挑战,我们必须将经济理论的基本见解与数据科学模式的发现能力结合起来。
开发更有价值的工具
当第一台望远镜被发明出来时,天文学家面临着如何理解大量新信息的挑战。仅仅收集详细的观察结果是不够的,天文学家需要关于行星运动的理论来区分有意义的模式和测量中的随机变化。今天的社会科学家在大数据时代面临着相似的挑战。
理论和数据是相辅相成的,我们需要在二者之间找到平衡。虽然现代技术的发展使我们能够建立复杂的模型来跟踪数据中的每一个模式,但具有良好理论基础的简化模型通常能更好地预测新情况下的不同行为。经济理论框架呈现了人类的基本特征,尽管对于特定的案例来说并不完美,但这些见解提供了跨情境的长久解释力。
正如在烹饪的类比中,最好的厨师会将烹饪的基本原则与对特定食材和条件的设定结合起来。同样,社会科学研究的未来不在于在理论和数据之间作出选择,而在于将二者进行有机的结合。我们需要经济理论来告诉我们应该往哪个方向思索,哪些模式可能重要,同时使用现代数据分析来检验和完善这些理论。
这个问题对于非学术界同样具有深远的影响。政策制定者试图预测新法规的影响,企业试图了解新市场,机构组织致力于解决社会问题,他们都需要预测人们在新情况下的行为方式。证据表明,最好的方法是将有关人类行为的理论原则与对相关数据的翔实分析结合起来。当我们面临越来越复杂的社会挑战时,在二者之间找到平衡变得更加重要。我们的目标并不是建立人类行为的完美模型,这是一项不可能完成的任务,而是开发更有价值的工具来理解和预测人们对新情况的反应。
(作者系美国犹他州立大学发展与机遇研究中心高级研究员;英国伦敦大学学院教育学系博士)
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>