社会科学和计算机科学与工程领域的结合产生了一个新的研究领域:计算社会科学。该领域将计算方法应用于新的数字数据来源(如社交媒体、行政记录和历史档案)以发展人类行为理论。2020年4月,伯尔尼大学阿奇姆·埃德尔曼(Achim Edelmann),杜克大学汤姆·沃尔夫(TomWolff)、丹妮尔·蒙塔涅(Danielle Montagne)和克里斯托弗·贝尔(Christopher A. Bail)在《社会学年鉴》(Annual Review of Sociology)上发表题为《计算社会科学与社会学》(Computational Social Science and Sociology)的文章,通过文献计量学分析了在社会学领域中计算社会科学的演变,并深入分析了七个迅速发展的分支领域。
1.社会网络分析与群体形成。计算社会科学在社会学中出现的第一个领域是社会网络分析与群体形成。互联网、社交媒体平台和电信数据的发展启发了首批人口层面的研究,比如2004年,瓦特(Watts)及其同事利用电子邮件数据来演示和阐述数字空间中的核心社会科学理论。近年来,越来越多的研究使用数字数据来检验复杂的传播性在社交网络中的扩散。例如,森托拉(Centola)创建了一个可以控制社交网络拓扑结构的在线社区,在其2010年发表的成果中展示了不同网络内部的扩散性。此外,社交媒体和电信数据也使规模空前的网络分析成为可能。2017年,贝尔等人利用脸书(Facebook)的数据确定了在一个讨论公共卫生问题的大型网络中,情感传播和理性交流方式之间的协同作用。另一系列研究通过在线游戏或测试来研究网络动态,斯基拉多和克里斯塔基斯(Shirado & Christakis)在2017年发表论文,通过引入机器人参与在矩阵中协调颜色的游戏来增强人类群体的集体表现。网络测试在研究群体智慧和政治信仰方面也具有重要影响力。吉尔伯特(Guilbeault)等人在2018年发表论文,使用亚马逊的“土耳其机器人”(Mechanical Turk)进行了一项在线实验,测试保守派和自由派的社会网络差异如何影响受试者对美国宇航局(NASA)气候通讯的解读。
2.集体行动与政治社会学。计算社会科学激发了大量关于集体行为和政治的研究。尤其是来自社交媒体和其他交流平台的数据,进一步促进了对集体行为的研究。图菲克西(Tufekci)和威尔逊(Wilson) 2012年的研究显示,在埃及革命和“占领华尔街”运动中,数字工具在抗议活动中发挥着核心作用,由这些工具生成的数据可以为集体政治的研究提供信息。计算技术也帮助研究者发展了社会运动中动员和行为改变的相关理论。2015年,瓦西(Vasi)等人利用来自社交媒体和谷歌的数据展示了在放映纪录片的社区中,在线讨论和反对这种做法的动员是如何增加的。另外,文本数据的增加启发了政治话语方面的新研究。贝尔在2015年以及博尼科夫斯基(Bonikowski)和德伦(Gidron)在2016年通过分析话语领域内行动者的社会地位及其语言的情感价值,论证了边缘话语是如何进入主流的。在这一领域,许多研究使用在线数据、自动文本分析、实验和基于主体的建模来研究政治极化和说服。2017年,布蒂琳和威勒(Boutyline&Willer)基于网络的研究表明,两极分化源于保守派和极端主义者之间的同质性。
3.知识社会学。计算社会科学已经成为知识社会学的中心部分。这一领域的研究主要利用引文数据来研究科学内部共识的形成。文本分析的进步帮助学者绘制和建模整个科学领域的成长过程,也使学者们能够阐明学科之间的异同。比如,2007年,伍奇(Wuchty)等人的研究发现,在社会科学领域,团队合作的倾向在过去50年里增加了一倍多。2018年,麦克马汉和埃文斯(McMahan & Evans)开发了一种方法来捕捉科学文章中语言的模糊性,以区分自然学科以及人文学科的差异。还有一些研究考察了学术工作如何获得影响和声望。2013年,乌齐(Uzzi)的研究表明,高影响力的出版物建立在先前卓著的工作基础上,同时又具有不同寻常和新颖的组合。计算方法也揭示了科学发现如何被单个科学家的选择及其组织背景驱动。2015年,热采斯基(Rzhetsky)等人确定了生物医学科学家在选择要研究的分子之间的关系时所遵循的策略。这一领域的另一系列研究是利用计算技术来研究科学的公众形象以及科学如何与工业相结合。2015年,什维德(Shwed)展示了烟草业阻碍科学探究的尝试反而使科学家发现了吸烟危害的悖论。最后,计算技术更普遍地揭示了科学和在线知识表征中的性别不对称和不平等。2013年,怀特(West)等人追溯了自1545年以来,自然科学、社会科学和人文学科学术作者中的性别不平等现象。
4.文化社会学、社会心理学和情感学。计算社会科学也出现在文化社会学、社会心理学和情感学的研究中。在文化社会学中,部分研究考察了文化变迁的广泛过程。2015年,贝尔展示了自动文本分析如何被用来检验话语场的转变以发展一个系统的共鸣理论。以文本为基础的数据的增长也开启了关于文化信息如何表达的研究新领域。2011年,戈德和梅西(Golder&Macy)利用数以百万计的推特公开信息数据,确定了全球不同文化中个体层面上的昼夜和季节性情绪节奏。除了文本分析,学者们还率先使用虚拟现实来进一步研究社会心理学的核心问题。2018年,范·隆(Van Loon)等人让被试者执行合作任务,但将其中一半人随机分配到一种治疗条件中,使用虚拟现实技术获取其他研究参与者的观点。
5.文化的生产。计算技术经常被用来研究人们如何评价以音乐、电影为代表的文化产品。2006年,萨尔加尼克(Salganik)等人创建了一个在线“音乐实验室”,研究同伴如何影响新艺术家的音乐偏好。计算技术也被用来衡量文化产品中主题的组合如何塑造其接受度。最近的研究探讨了性别、阶级和政治身份如何塑造文化产品生产方面的问题。2016年,陈云松和严飞利用谷歌图书大数据来研究经济发展与阶级关注度之间的关系,这是唯一被引用的中国大陆学者文章。
6.经济社会学与组织。计算技术和网络方法的交叉也在经济社会学中蓬勃发展。网络数据不仅对研究交流和职业成果有用,而且对研究组织文化也有用。2016年,戈德堡(Goldberg)等人分析了大公司内部的电子邮件信息,以衡量员工的沟通是否符合惯常的规范和行为方式。研究发现,除了网络数据,文本通信的数字化记录提供了对文化和情感在市场中作用的更丰富的理解。2011年,萨韦德拉(Saavedra)等人通过文本分析揭示了市场波动如何影响交易者讨论当前或未来的条件,以及这些变化如何影响交易行为。
7.人口统计与人口研究。计算社会科学在人口统计学中出现的时间相对较晚,但迅速流行。计算技术在这一领域最常用于产生高质量的人口估计。例如,手机数据被用于产生更具动态性的人口估计,特别是在国家统计数据不可靠的地区(塞萨尔等<Cesare et al.>,2018年;英格丽特 <Eagleet>,2010年;帕尔梅雷特<Palmeret>,2013年)。人口统计学家也使用计算技术来探索人口变动过程的微观动力学,最近的几项研究使用来自一个大型网络约会平台的数据,研究了人际关系是如何跨越种族和民族差异形成的。人口统计学家所做的计算社会科学研究的最后一部分是使用数字数据源来研究对社会有害的健康行为,并列举难以获取的人口资料。例如,2016年,卡什雅普(Kashyap) 和比亚维森西奥(Villavicencio)使用谷歌搜索数据来研究印度选择性堕胎的流行情况。受数据科学领域惯例的启发,其他学者开发了全新的人口研究模型。在这些领域中,通常会创建一个竞赛,多个团队通过竞争建立模型以获得现金奖励。一个典型例子就是网飞(Netflix)公司的竞赛,竞赛奖项会颁发给数据科学家团队建立的模型,而这一模型要为网飞用户可能喜欢看的节目提供最优质的推荐。
正如该文所说的,计算社会科学正在向许多诸如社会网络分析、知识社会学等以往未涉足的全新领域扩展,以至于任何文献综述都会在短时间内过时。尽管计算社会科学在推进社会学理论方面有着巨大的潜力,但也带来了许多紧迫的挑战,比如从伦理道德到数字空间数据生产的日益不透明等。作者认为,未来研究中计算社会科学对分支领域还有更大的渗透潜力,并呼吁增加计算社会科学与其他社会科学领域的互动,以确保计算社会科学继续扩展到主流社会学当中。
(南京大学社会学院 许子妍/编译)
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>