本报综合外媒报道 美国马里兰大学信息学院助理教授艾琳·帕斯奎托(Irene Pasquetto)等人近日于英国伦敦政治经济学院“影响力博客”官网发表文章,确定了七种研究数据滥用的形式,并为政策制定者、研究人员和数据专业人员如何应对由此带来的风险提供了建议。
开放科学的发展鼓励研究人员进行数据分享,以提高学术研究的透明度,推动学术创新与合作。但是,开放科学也会带来数据滥用等风险,破坏人们对科学的信任,阻碍科学的进步。例如,在新冠疫情期间,关于疾病感染率和疫苗有效性的一些未经证实的数据在社交媒体上传播,助长了人们对疫苗的怀疑情绪。
关于如何定义数据滥用存在一定的挑战。帕斯奎托表示,首先,数据滥用的涵盖范围广泛,可能源于无意的错误,如分析过程中的方法错误,也可能源于故意的行为,如出于某些特定目的进行数据操纵。其次,数据滥用认定缺乏共识。一个研究团队认为是滥用的数据,在另一个研究团队看来可能是可接受的。例如,未经同意重新使用某些数据在一个研究领域可能被认为是不道德的,但在另一个研究领域却是可以被接受的。再次,随着科学变得更加开放和透明,非专家类人群越来越多地参与到科学数据的解释过程中,而大多数现有的数据共享和重复使用的管理指南仍然是为专家的数据实践量身定制的。
为此,帕斯奎托等人总结了数据滥用的七种常见形式。一是分析错误,这些错误常常产生于数据分析过程中,此类错误可能源于缺乏对数据背景的理解。二是误解,这源于对研究数据的内涵或意义的错误理解,有可能导致错误的结论。三是曲解误传,即数据可能被有意或无意地操纵以支持特定的观点。四是声誉损害,这种数据滥用是以损害原始数据收集者、分析师或管理员声誉的方式使用或呈现数据。五是侵犯隐私,在生态学或生物医学等领域,数据滥用可能导致隐私侵犯,如个人身份信息被共享。六是剥削,在某些情况下,一些从边缘社区收集的研究数据在没有公平补偿或利益分享的情况下被滥用,这可能会加深现有的不平等。七是不加批判地使用带有偏见和攻击性的数据,这种滥用使一些刻板印象或叙述呈现永久化。
对于如何防止或减少数据滥用,帕斯奎托等人提出了以下建议。对数字管理进行投资,配备专业的数据管理人员;鼓励数据重用者对研究实践进行自我反思;除了元数据之外,采用不同形式的数据描述形式,如数据论文或自述文件;鼓励数据重用者复制数据,同时明确说明在数据分析中发现的最终错误;在适当的情况下与社区合作,确保为研究提供数据的社区能够获得切实利益。
帕斯奎托等人表示,在开放科学中,研究数据的滥用是无法避免的,但这不应该成为不发布关键数据的理由,也不应成为躲避应对数据滥用的借口。在此过程中,负责策划、发布和管理开放研究数据的中介机构需要积极主动地预防、减轻和响应研究数据的滥用。(王俊美/编译)
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>