珀尔为人工智能理解因果关系提供思路
2021年11月29日 11:04 来源:《中国社会科学报》2021年11月29日第2297期 作者:杨小军 张鑫

  “贝叶斯网络之父”、美国计算机科学家和哲学家朱迪亚·珀尔(Judea Pearl)以在人工智能领域的基础性贡献而知名。他提出概率和因果性推理演算法,改变了人工智能最初基于规则和逻辑的发展方向,并因“研发与概率和因果推理有关的算法而在人工智能领域作出杰出贡献”获得了2011年度图灵奖。珀尔在其近年来的研究成果中多次提出,当前人工智能对因果关系的分析,不恰当地依赖基于大数据的概率统计,使人工智能难以实现跨越式发展。为此,他提出对因果关系理论的新看法,针对不确定性因果关系分析,开发贝叶斯网络和结构因果模型,并用它们处理因果关系分析中存在的潜在信息和干扰信息,为分析复杂因果关系提供了新视角。

  提出因果关系之梯概念

  哲学家大卫·休谟(David Hume)认为,因果关系是人的一种想象,人类通过想象将两个经常相伴存在的事件之间的关系总结为因果关系。珀尔提出,因果推断能力是人的根本能力,要破解因果关系密码,让人工智能或者机器人具有因果推断能力,就要对人的因果关系意识进行系统分析。

  珀尔从人的因果关系意识形成过程出发,提出因果关系之梯的概念。在他看来,人类需要借助观察能力、实践能力和想象力,并经过关联、干预和反事实推理这些步骤才能实现因果推断。观察能力是人所具有的收集、整理信息的能力,也是规律性认识产生的基础。实践能力是通过调整周围条件达到预期效果、建立非自然的简单因果关系的能力。想象力则可以帮助人们将对某一事物及其与其他事物关系的认识,上升为一种普遍的、统一的认知,有助于找到事物间的潜在因果关系。若一个生命体获得了上述三种能力,该生命体便具有理解因果关系和建构因果关系的能力。

  珀尔借助“因果关系之梯”对因果关系意识进行逐层解构。第一层为关联,即观察者通过观察,寻找规律,在自身意识中建立因果关系图。第二层为干预,即观察者将观察与主动改变相结合,在意识中调节因果概率图。第三层为反事实推理,在这一层面,观察者需要构建一个假想世界,假设造成某种结果的条件不存在,并推理出在这种情况下相关结果会如何变化,验证因果关系是否成立。珀尔发现,人可以轻易地通过意识活动分析不确定性因果关系,挖掘潜在信息,排除因果关系中的干扰因素。

  开发贝叶斯网络分析因果关系

  在对人类因果关系意识形成过程进行系统分析后,珀尔发现,人类可以通过搭建因果关系之梯处理不确定性因果关系。因此,他将目光从只分析确定性因果关系的传统路径,转向开发不确定性因果关系处理方法,并提出了贝叶斯网络理论模型。贝叶斯网络在发展过程中涉及三个核心概念,即有向无环图、条件概率表和马尔可夫条件。

  有向无环图是一种无回路的有向图,多用于展现由多个相关事件构成的复杂因果关系。一部分有向无环图呈树形结构,因而被称为有向树,利用这种树形图可以更加直观地分析复杂因果关系。例如,分析一个王朝的发展时,需要从政治、经济、文化、环境等方面进行综合分析,还需要呈现不同要素相互影响的程度,这时就可以利用有向无环图来分析其中的因果关系。有向无环图的出现使同时有效分析因果关系中的多个原因成为可能。

  条件概率表是指将多组相关事件发生关系概率进行对比的概率表,通常在三种以上互相关联的条件出现时,需要使用条件概率表。例如,企业分析员工到岗情况时,需要考虑多个因素,以及这些因素间的相互影响概率关系,这时就可以利用条件概率表进行整体分析,使不同因素间的相关性得到直观展示。条件概率表可以一次性分析多个多层次因果关系,提高了因果关系分析效率。

  马尔可夫条件是通过收集与主要事件相关的相对独立要素,分析在一定情况下各要素表现的方法。当独立事件在过去、现在和未来都可能与主要事件有一定关联时,这种看似独立的事件就具有了马尔可夫状态。通过设定不同结果分析独立事件的不同状态,可以预测整个事件的发展过程,即不同的独立事件状态有不同的期望报酬。同时也可以根据马尔可夫过程绘制马尔可夫链,将复杂的因果分析过程可视化。通过事例我们可以更好地理解马尔可夫条件的作用。若一位作家需要在一个月内交三篇小说,且要保证作品质量才能收到稿费。此外,他还有两份兼职要同期完成。这时利用马尔可夫条件进行分析预判,可以帮助他合理安排时间,获得最优结果。马尔可夫条件为因果关系分析提供了动态分析新维度,为动态因果问题最优化解决提供了路径。

  利用结构因果模型描述因果关系

  虽然贝叶斯网络在因果关系分析中能够发挥重要作用,但它无法准确解释因果关系,为了提升对因果关系描述的精准度,珀尔提出了因果关系的数理框架——结构因果模型。利用结构因果模型可以检验复杂因果关系,结构因果模型的主要组成部分包括概率图模型、结构化方程模型和扰动模型等。

  概率图模型结合了概率论和图表理论,能够对不确定的、无方向的、抽象的关系进行精准高效可视化描述。若要设计一个国家级体育场馆,设计者不仅要考虑这个场馆的基本功能,还要考虑该场馆未来可能需要增加的新功能,即使这些新功能仍处于未知状态。这其中涉及的因果关系包含许多不确定性因素和抽象问题,为了解决此类问题,需要建立概率图模型。概率图模型的独特之处在于,无论涉及的数据和知识多么复杂,处理手段都相同。这种优化处理方式综合了图表制作和概率分布,适用于不同类型的因果关系问题,降低了复杂性因果关系问题的分析难度,能够提高因果关系分析成功率。

  结构化方程模型是一种对潜在变量间关系进行建模分析的方法,是一个可以用于多元变量分析的因果结构性框架。例如,在分析智商、情商、成功三者间关系时,通常难以直接进行量化测算,需要对相关潜在变量进行规模上的“估计”,然后再建模分析。利用结构化方程模型能够同时挖掘可观测到的显性变量和未观测到的隐性变量。可见,结构化方程模型可以将潜在信息挖掘出来,实现数理化因果关系理论分析,为人工智能理解更深层次的因果关系提供了可能。

  扰动模型是一种能够分析因果关系产生过程中存在的不同程度干扰因素的模型。运动员比赛成绩会受到各种因素的影响,其中有确定性干扰因素,也有不确定性干扰因素。要想避免不确定性干扰因素出现,就需要通过建立扰动模型,分析可能出现的不同种类、不同量级的干扰因素,并以此为基础制定最优化解决方案,以获得人们期望的最佳结果。

  概率图模型、结构化方程模型和扰动模型共同为人工智能不断迭代的深度学习提供了理论框架,也为新技术时代的因果关系研究提供了不同以往的路径。

  珀尔系统分析了人类因果意识的产生过程,为人工智能理解因果概念提供了新思路。贝叶斯网络和结构因果模型成为分析不确定性因果关系、潜在信息和复杂干扰因素影响的重要方法。珀尔对人工智能研究手段的创新,促使人工智能的研究路径从专家系统研究向深度学习研究转变,对于进一步探索因果关系具有重要意义。

  (作者单位:湘潭大学马克思主义学院)

责任编辑:崔岑
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026