过度追求模型的复杂性适得其反
2022年12月02日 07:56 来源:《中国社会科学报》2022年12月2日第2543期 作者:本报记者 陈禹同
建立数学模型并以此为基础进行数据分析,是当前被广泛应用于各科学研究领域的一种研究方法。对于如何权衡模型复杂性与准确性的问题,英国伯明翰大学地理、地球与环境科学学院副教授阿纳尔德·普伊(Arnald Puy)和挪威卑尔根大学科学与人文中心客座研究员安德里亚·萨尔泰利(Andrea Saltelli)等学者,近日在美国期刊《科学进展》上发表了题为《具有更高有效维度的模型倾向于产生更多不确定的估测》的探讨文章。该文提出,过于追求提高模型复杂性可能让模型输出更多不准确的结果,进而限制其在助力政策决策方面发挥作用。
普伊告诉记者,将模型的日益复杂化作为获得更精确数据的手段,不仅可能无法实现目标,还有可能使得估测更模糊。在过去几十年里,为了与新的科学发现保持同步,关于水文过程、气候变化、流行病传播等问题的数学模型变得越来越复杂。它基于这样一种假设:添加细节将使这些模型更好地反映所涉过程的潜在机制,从而导向更准确的估计或预测。但是,想以清晰到不存在测量误差的方式发掘新的参数或机制是非常困难的,随之而来的往往是新的不确定性。此外,有不止一种数学方法能被用于指代新发现的变化过程,对于同一个机制,可以用几种不同但同样成立的替代方法进行数学意义上的形式化描述。
普伊表示,他们的研究成果显示,更复杂的模型容易产生更不确定的估测,这是因为它们通常会有更高的有效维度。这意味着有更大量的参数在给模型输出带来不确定性,以及更多的活跃的高阶效应。因此,他建议,当研究人员把一个模型扩展到包含更多细节时,需要考虑到新增的参数或机制带来的不确定性。这些新的不确定性叠加在现存的不确定性之上,由此产生的是一个非常复杂、具有更大不确定性的模型。
萨尔泰利对记者谈道,从助力政策决策的角度看,如果一个模型有助于社会更好地理解某个问题并选择合适的行动路线来应对该挑战,那么这个模型就是有效的。模型可以就流行病的预期影响和后果发出提醒,可以评估某种资源在可预见的未来是否会耗尽,也可以用于探索某种新兴技术的利弊。考虑模型的大小和复杂性是为了保障其准确性(真实预测)和精度(误差小)。当模型极其庞大而复杂时,它的预测会有较强的不确定性,尽管这一变化对旁观者而言一般是不易察觉的。在萨尔泰利看来,当数学和研究人员过于雄心勃勃的抱负结合时,会构成一个危险的组合:建模者渴望创建出更详尽的模型,但这需要他们做出自带不确定性的选择。最终,不确定性累积起来,使得一个看似客观精准的庞大模型在预测方面不尽如人意。建模者之外的人通常不太了解结论是如何得出的,不确定性因素是什么,还可以得出哪些替代性结论。如果模型不具备良好的预测能力,而社会成员及其代表却选择信任建模者,并以模型为参考和依据来做决策,自然会产生不理想的结果。
普伊表示,不确定性很难被彻底消除,勇敢地承认多义性、模糊和未知情况的存在有助于完善知识生产过程。否则,科研工作创造的知识不仅可能是站不住脚的,还可能在人们试图理解未来的复杂挑战时提供一个狭隘的视野。萨尔泰利强调,对科学及其所取得成果的尊重,并不意味着对科学界的任何产出都随意放行。无论是研究人员还是普通民众,都应秉持更加谨慎的态度。模型的建立与分析需要接受严格的审议,科学界内部的声音和该模型所关联政策涉及的民众意见都需要被听到。
责任编辑:常畅