多角度思考数据科学与数字鸿沟
2021年08月23日 08:59 来源:《中国社会科学报》2021年8月23日第2235期 作者:本报记者 王悠然

  数字鸿沟是指现代信息工具拥有者与未拥有者之间,在信息可及性上存在巨大差异,具体表现为信息技术带来的益处在社会中的不平均分配。这一概念首先出现于1995年的美国,此后不久传播到欧洲及世界其他地区。到2000年,学界就数字鸿沟的具体概念及涵盖的相关问题基本达成共识。近年来,数字技术本身的发展及其对社会的价值和影响成为各界共同关注的重大议题,相关讨论不断深入,相关学术研究的视角和方法也日益丰富多样。数字鸿沟一直是学界颇为关注的问题,特别是针对弱势群体如何跨越数字鸿沟的问题,各国政府纷纷进行了政策尝试。

  数字鸿沟研究逐级深入

  据荷兰特文特大学传播学系荣休教授简·凡·迪克(Jan A. G. M. Van Dijk)介绍,数字鸿沟及相关研究可分为三个层面,对应三个时期。

  第一个是物理访问层面,从1995年至2003年。1995年,美国《洛杉矶时报》首次使用“数字鸿沟”一词。随后,美国国家电信和信息管理局发布报告《“漏网之鱼”:针对美国农村和城市中信息穷人的一项调查》,描述了美国农村和主要城市中无法享受到国家信息基础设施的人群特征,包括低收入家庭、原住民和少数族裔、受教育程度较低者。报告中多次提及“数字鸿沟”,让这一概念在媒体和美国政界流行起来。2001年,英国政治学家皮帕·诺里斯(Pippa Norris)出版的《数字鸿沟:世界范围内的公民参与、信息贫穷与互联网》一书,成为首部被经常引用的关于数字鸿沟的学术著作。诺里斯主要讨论了数字鸿沟的物理访问层面,即是否拥有计算机、是否可以接入互联网,并区分了发达国家与发展中国家之间的全球鸿沟、一国内部富人与穷人之间的社会鸿沟、是否将互联网资源用于社群参与的民主鸿沟。

  1995—2001年,美国和一些欧洲国家的计算机拥有率和互联网接入率大幅上升,人们对新的信息通信技术总体上抱有积极乐观态度。但在2001年前后开始出现另一种声音。有学者提出,数字鸿沟并不存在,这一概念本身就是伪命题。不少民众也认为,数字设备和服务与广播、电视、电话等一样,也会出现“涓滴效应”,最终会普及每一个人。2000—2005年,关于数字鸿沟的研究成果发表数量达到高峰。这些研究和讨论由经济学家、电信学研究人员、政策制定者或商业领导人主导,而且这些主导者几乎都是美国人。他们持技术决定论观点,认为新技术的传播充满机遇且不可避免,市场力量被启动后,数字设备和服务将会全面普及。

  第二个是技能和使用层面,从2004年起延续至今。这一时期,学者和政策制定者开始跨出物理访问的讨论范畴,社会科学家首先提出“数字鸿沟是一个复杂的动态现象”。美国纽约市立大学社会学教授保罗·阿特维尔(Paul Attewell)、瑞士苏黎世大学互联网使用与社会研究教授埃斯特·哈吉泰(Eszter Hargittai)等人强调了信息技术使用和数字素养的不平等。他们的核心观点是:如果没有必要的技能、知识、对有效使用的支持,拥有物理访问是无用的。数字鸿沟问题首先是社会、经济、文化和政治问题,而非技术问题。

  这一时期,计算机体积越来越小、运算速度越来越快、价格越来越低,互联网接入率和计算机购买量迅速上升。2004—2014年,互联网使用者在世界总人口中的占比从不足15%上升至接近45%。2004年以来,社交媒体和智能手机行业蓬勃发展,极大地改善了用户体验。21世纪第一个十年,互联网成为发达国家70%以上人口日常生活的一部分。不过,在发展中国家,接入并使用互联网的人口比例远低于发达国家。各国政府机构和教育机构逐渐意识到,只有让互联网新用户获得技能和相关应用程序,才能支持经济、社会和文化发展。

  因此,随着互联网的快速普及,数字鸿沟研究的焦点转向新用户技能,研究范围大幅扩展,并将机会和不平等话题纳入进来。2004年以来,“数字鸿沟”一词在学术出版物中越来越少见,关键词转变为“互联网/社交媒体使用”“数字/信息素养”“数字技能”等有关机会、不平等和应用的概念。2004—2012年,关于数字素养和互联网使用类型学的新的概念框架和操作性定义不断涌现,一些研究人员开始在实验室、田野实验和调查中测试数字技能。这个阶段数字鸿沟研究的另一个焦点是用户群体,许多学者注意到与知识鸿沟相似的“使用鸿沟”开始出现——一些人主要使用有助于其获取信息、接受教育或增强职业竞争力的互联网产品,另一些人则主要使用娱乐以及简单的商业和交际用途的互联网产品。2004年以来,大部分数字鸿沟研究聚焦于计算机和互联网使用的差异和不平等。这些研究虽然仍以美国为主,但英国、荷兰、西班牙、巴西、智利、墨西哥、韩国、新加坡、中国的研究更加丰富并受到关注,说明这一领域变得日益国际化。

  第三个是结果层面,从2012年延续至今。随着计算机和互联网的普及,一些学者和政策制定者开始思考数字鸿沟对公民、机构和社会的影响。2012年,西班牙马德里自治大学社会学系教授克里斯托巴尔·托雷斯·阿尔贝罗(Cristóbal Torres Albero)和马德里康普顿斯大学应用社会学系讲师何塞·曼努埃尔·罗布雷斯·莫拉莱斯(José Manuel Robles Morales)开展了一项互联网访问和使用调查并提出,未接入互联网且不具备必要技能的人将无法受益于越来越多的无线下替代品的网络服务。同年,简·凡·迪克和荷兰特文特大学传播学教授亚历山大·凡·德尔森(Alexander J. A. M. Van Deursen)调查并发现,数字技能缺乏和数字技术故障导致荷兰劳动者生产率降低。同时,受教育程度较高的人、年轻人受益于互联网的程度远高于受教育程度较低的人、老年人。

  过去5年里,互联网及终端设备进一步普及。“数字落后者”在发达国家人口中占比为10%—33%,但在发展中国家仍高达50%—90%。研究人员和政策制定者都开始关注互联网和数字媒体使用的结果。有人对数字鸿沟的特殊性发出疑问——毕竟在每个时代都有新的技术问世。在简·凡·迪克看来,新兴信息通信技术的访问和使用比印刷媒体、广播、电视、电话更重要,因为前者是通用型技术。传统技术虽然对知识获取、娱乐、通信起着重要作用,但互联网和数字媒体是当代社会中每个人在扮演任何角色时都需要的。数字鸿沟影响着个体在教育、工作、市场、社群、政治和文化等领域的参与度,决定着个体是融入社会还是被排除在外。

  批判性数据研究兴起

  进入21世纪第二个十年,数字基础设施建设和应用加速,大数据、人工智能技术迅猛发展,物联网快速兴起。互联网和数据对社会的作用和影响与日俱增,许多重大问题随之产生。例如,大规模研究数据将帮助我们创造更好的工具、服务和公共物品,还是掀起隐私侵犯和侵入性市场营销的新浪潮?数据分析学是否有助于理解网络社群和政治运动,是否将改变我们研究人类交际和文化的方式?于是,批判性数据研究领域应运而生。

  2012年,美国微软研究院研究员达纳·博伊德(Danah Boyd)和高级首席研究员凯特·克劳福德(Kate Crawford)发表文章《大数据的批判性问题》称,大数据的崛起既是技术现象,也是社会现象,因此有必要批判性地质疑相关假设和偏见。她们将大数据视为一个以技术、分析、神话的相互作用为基础的文化、技术和学术现象。技术指的是将计算能力和算法准确性最大化,以收集、分析、联系和比较大型数据组;分析指的是基于大型数据组来识别模式,以提出经济、社会、技术和法律规范;神话指的是大型数据组提供了更高级的智慧和知识形式,由此产生以往不可能获得的见解,并带有真理性、客观性、准确性的光环。博伊德和克劳福德提出了六个论点,以期激发各领域关于大数据的讨论:大数据改变了知识的定义;宣称大数据绝对客观、准确具有误导性;大数据不总是更好的数据;如果脱离背景,大数据将失去意义;能够获取不意味着符合伦理;对大数据的有限访问造就了新的数字鸿沟。

  《大数据的批判性问题》激起了学术界对批判性数据研究的兴趣,首次使用“批判性数据研究”这一术语的是美国霍夫斯特拉大学全球研究与地理学助理教授克雷格·M.道尔顿(Craig M. Dalton)和美国华盛顿大学塔科马校区城市研究助理教授吉姆·撒切尔(Jim Thatcher)。他们在2014年发表的文章《批判性数据研究是什么以及我们为什么关心它?》中提出若干关键论点,以推动对新的数据制度的全面批判。

  第一,必须将大数据置于时间和空间当中。19世纪的统计制图、社会物理学,20世纪五六十年代的地理学计量革命、基于地理人口细分的市场营销以及信息技术产业的盛衰循环,都为大数据时代的到来创造了条件。如今,大数据嵌入社会过程中,催生了企业、政府、公民之间的、新的权力几何学。我们必须提问:数据是谁的?数据收集依据何种规范?目的是什么?

  第二,技术永远不像看起来那样中立。在创造和解读大数据的过程中,大数据技术永远与文化环境相互决定。对大数据的工具性审视,将导致人们忽视大数据技术产生的根本性的认识论影响。我们必须提问:被量化意味着什么?大数据作为一种技术形式,对我们的文化和生活带来什么样的可能性和约束?

  第三,大数据不能决定社会形态。技术变革与社会之间的关系错综复杂,大数据在社会变化中的作用远不是数据分析或对社会建模这么简单。技术的创新、生产、应用普及发生在充斥着权力、经济、身份、偏见等元素的社会背景下,并反映社会背景。一种技术不可能脱离其背景单独起作用,更不能决定社会形态。

  第四,数据从来不是未加工的。对一切数据的生产和解读,都是社会实践的结果。每个数据模型对信息编码和建立结构的方式,都遵循了研发人员的设想。哪些信息被量化、存储、分类?哪些被丢弃?任何数据组都是对世界的有限表现,这样理解数据才能使其揭示出某些有意义的规律。

  第五,“大”不意味着一切。大数据分析不可能回答所有问题,因此它不能替代更加成熟的定性和定量研究方法。在定性研究中,科研人员通过直接询问参与者的个人感受和动机,得到关于参与者立场的深度、细节化信息。在田野研究中,科研人员亲身体验一个地方、一种背景,这些都是大数据难以提供的。此外,关联性与因果性之间的区别、数据组的价值等问题在大数据时代依然存在。将大数据与“小数据”及其他已有的研究途径结合起来协调使用,能够在研究话题、方法、概念、意义等方面开辟新的可能性。

  2016年,美国赛吉出版公司旗下期刊《大数据与社会》出版《批判性数据研究》专刊,多国学者从哲学、治理、科研伦理、金融市场、农业、发展和援助等角度探讨了数据与整个社会以及个人日常生活之间的相互作用。他们表示,批判性数据研究为人们提供了必要的工具,人们可以运用这些工具提升自身的数字素养,并为数据公正作出努力。批判性数据研究还应鼓励人们在共同利益框架和社会背景下思考数据科学。

责任编辑:陈静
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026