自新冠肺炎疫情发生以来,在世界各国学者的共同呼吁下,与疫情相关的数据被大量公开,但这些数据并非都具有可利用价值。11月17日,英国伦敦政治经济学院发文称,目前,全球需要更详细、开放及可用的数据分享,以助力科研与政府决策。
提高数据质量
2020年1—5月间,许多人密切关注疫情进展,通过社交媒体平台获得与疫情相关的最新消息,如病例数量、发生位置等。有一类交互式地图可以实时展示此类信息,其中比较有名的是美国约翰斯·霍普金斯大学的“全球新冠病毒疫情仪表盘”。这些交互式地图已经成为向公众展示与疫情相关信息的重要工具。
文章显示,仅能获取简单的数据还不够,研究人员亟须思考如何从细节、开放存取和可获得性方面提高数据的质量。首先,从细节来看,病例数量比较容易收集和汇总,但缺少有关感染者的更多详细信息。例如,感染者的年龄和性别、是否去过其他国家或地区、何时出现症状及症状的表现程度等。研究人员和政策制定者可以利用这些额外的信息,告知公众如何防范疫情传播、哪些人群更易被感染,以及减轻其影响的最佳方法。
其次,通过开放存取或其他各种共享机制,把这些数据免费提供给所有相关方,将产生巨大价值。疫情期间,数据的公开分享比以往任何时候都重要,这是确保数据透明性和可靠性的一种方法。数据的开放存取促进了跨学科合作,从而进一步加深人们对疫情的了解,使跨越国界的协调工作和应对策略更加及时。
最后,高质量的数据是科学发展的动力,但如何获得高质量的数据却面临挑战。如果数据的可获得性很低,研究人员不仅要在寻找数据的过程中耗费大量精力,更难以通过分析数据获得成果,助力政策制定。数据收集过程的透明化可以提高获取信息的可靠性,然而,数据的可获得性问题一直存在。早在2014—2016年西非埃博拉疫情和2015年美洲寨卡病毒流行期间,病例信息难以获得的问题就已出现。新冠肺炎疫情发生以来,这一问题变得越来越突出。
优化数据分享过程
科学界越来越重视公开分享数据的价值,这些数据使新的科学发现更加坚实可靠。文章建议,从数据来源的多样化、科学合作、加快报送速度等方面优化数据分享过程。
理想的数据收集方案通常依赖于主要数据源,如国家卫生机构收集的官方信息。现在,诸如美国“健康地图”(HealthMap)等数据汇总系统还承担了收集来自非传统来源信息的任务,此类系统经由互联网获取大量通过社交媒体共享的数据信息。数据源的多样性进一步提高了数据收集过程的可靠性和透明度,从而使单个数据集的交叉验证成为可能。
数据源的多样化与不同团队和机构的工作息息相关,随之而来的是,数据分析也需要科学界进行更广泛的合作。让不同的研究人员分析数据并探究相似的研究课题,可以增加数据的稳健性,并从中得出合理结论。该思路适用于任何循证研究。从长远来看,提高原始数据的可获得性可以驱动决策过程,测试决策的可持续性,并提高其有效性和实用性。
另外,数据的及时报送能够提高数据的实用性水平。应对疫情需要不同部门协调一致,尽管研究人员可以运用科学知识分析疫情及其传播过程,但只有将知识转化为快速有效的行动和政策,才会对社会产生实实在在的价值。目前,研究人员与政府官员之间的互动关系已经建立,但疫情的全球化蔓延要求越来越多的参与者能够采取协调一致的措施,这意味着各国响应和采取行动的速度会对国际社会产生重大影响。
统一数据收集方法
随着疫情的发展,越来越多的研究小组开始关注数据在可用性方面面临的挑战。文章显示,其中的关键问题之一是要在数据的规模和精度之间作出权衡。例如,“全球新冠病毒疫情仪表盘”虽然拥有最新的数据集,但有可能忽略个体病例的详细信息。即使有的工作组通过众包方式收集了详细数据,但数据的复杂性也会带来一定的局限性,导致出现人为错误和重复计算,由于各国采用不同的数据收集方法导致数据报送系统偏差,病例产生时间与报告时间之间存在延迟,病例计数不完整等。
文章建议,世界各国需要意识到统一数据收集方法的重要性。一线工作人员为收集数据付出了巨大的努力,在当今这个高度连接的世界,只有所有参与者都可以使用数据,才不会浪费工作人员付出的人力物力。此外,加快推动产出新的成果并协调各方行动,可以最大程度地提高数据收集的效益,使人们更好地把握疫情走向,为未来做好准备。
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>