大数据时代定量社会研究方法的革新与挑战
2022年07月13日 09:20 来源:《中国社会科学报》2022年7月13日第2447期 作者:林聚任

  大数据时代的到来不但深刻影响了人们对社会世界的认识,而且也为定量社会研究方法的革新提供了极大可能性。社会学研究通过与大数据的创新结合,将有可能重塑传统社会学定量研究的范式,开拓新的研究领域与方向。

  大数据带来定量社会研究方法革新

  随着现代信息技术的发展,我们已进入“数字时代”。大数据的出现和广泛使用正深刻改变着传统的社会研究,给定量研究方法的发展与革新带来了显著影响。

  第一,大数据让我们对社会研究数据有了全新认识。社会学研究长期以来受实证主义方法论影响,非常重视定量数据资料,而传统的定量数据主要是基于个体样本的调查数据。这类结构化数据虽然在代表性大样本条件下具有推论性和解释性,但因受调查研究条件等因素的影响,样本规模总是有局限性。而大数据的出现完全改变了数据的性质,让我们对社会研究的数据有了全新认识。

  所谓“大数据”,通常与云计算相关,是以海量数字为计量的以非结构化和半结构化为主要形式的数据,其主要特征包括数据量极大、数据类型多样、时效性高、应用价值广泛等。马修·萨尔加尼克在《计算社会学》中指出,大数据有利于社会研究的突出特征是海量性、持续性和不反应性。这些特征都是传统定量数据所不具备的。以往社会研究即使有足够多的大样本,但在数量上也是很有限的。而利用大数据可轻易获取几十万甚至更多分析对象的数据信息。正如萨尔加尼克所说:“不断增加的海量大数据意味着我们已经从一个缺乏行为数据的世界进入一个行为数据极其丰富的世界。”

  第二,大数据拓展了社会研究数据获取途径。传统定量社会研究数据主要依靠问卷调查或实验研究等专门法获取,方式有限且受多种研究条件的制约。进入大数据时代,我们获取数据的途径大大拓展。目前社会大数据存在于社会活动的各个领域,专门开发大数据的机构也越来越多,数据存储、挖掘和开发技术也在不断进步。这为我们获取和利用大数据提供了极大便利。

  在大数据时代开展社会研究遇到的难题,已经不同于传统社会研究常常受困于数据获取,越来越多的研究者感到数据或信息太多,面临难以取舍的问题。

  第三,大数据极大地发展了定量研究方法。近几十年来定量社会研究方法虽然不断发展进步,但总是存在一定的局限性。随着现代计算机技术和“云计算”的快速发展,分析方法和技术不断更新,从而极大地丰富和发展了定量社会研究方法。比如,基于互联网、物联网的数据挖掘与分析技术已有广泛应用。因此,在新的计算技术和方法基础上的社会科学研究,已在数据处理与分析方式上发生了重大变化,新的计算社会学与传统的定量社会学存在非常大的不同。也可以说,大数据及相关新技术的发展与社会科学研究的结合,形成了具有学科交叉性的计算社会科学,这为定量社会研究方法的创新提供了方向和可能性。

  合理运用大数据促进社会研究方法的整合与创新

  大数据的出现既为定量社会研究带来了前所未有的机遇,同时也带来了极大变革与挑战。有的学者甚至把与大数据相关的计算社会科学的兴起称为社会研究的一次“范式革命”。与此同时,这一发展也引起了学术界关于大数据的激烈争论,出现了一些相对立的观点。其实自从实证主义发展以来,关于定量研究与定性研究之间的争论就没有停止过,目前有关大数据之争是其新的表现形式。当然,我们已迈入数字化新时代,因此需要对相关问题形成新的认识。

  首先,社会研究应以开放和积极的态度对待大数据。当前我们已进入数字化的信息社会阶段,各领域信息的数字化已成为普遍的发展趋势,这就需要社会研究以更开放和积极的态度去对待大数据。从这个意义上说,掌握了数据也就有了“发言权”。定量社会研究离不开数据,更离不开大数据。当然,大数据既具有利于社会研究的性质,也有不利于研究的方面。比如,萨尔加尼克指出其不利性包括数据的不完整性、难以获取、不具代表性、算法问题、“脏数据”及敏感性等。

  尽管大数据及其应用存在一定问题,但这不足以影响当前社会科学研究对大数据的关注与使用。维克托·迈尔-舍恩伯格和肯尼斯·库克耶在《大数据时代:生活、工作与思维的大变革》中指出:“大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变。”这就要求我们重视大数据,以开放和专门化的方式接受和利用大数据。

  其次,社会研究还需以合理的方式利用大数据。利用大数据,不但要加深对其的认识,同时在实际研究思路与设计上也需革新,注意处理好如下两方面关系。

  一是处理好社会研究的目的与工具之间的关系。传统社会学定量研究的基本程序是预先提出研究假设,按照自己设计的研究框架收集定量数据资料进行分析。这种演绎式的研究逻辑主要是“理论导向型”的。而新的以大数据为主的社会研究逻辑看起来是“数据驱动型”的,即这种研究所依赖的大数据不是研究者按照事先设计的方法获取的,而是从其他途径直接获取的。由此,有学者指出大数据未必能够符合研究者的研究目的,甚至仅限于数据本身做分析会有很大局限性;或者存在“现实生活被裁剪”“社会情境被忽视”、社会研究的主体性缺失等问题。尽管有可能存在类似问题,但是我们也应从研究需求出发,注重对数据的甄别选择与利用。我们需要重视大数据利用,但不能完全陷于大数据之中。

  二是处理好传统定量社会研究与大数据方法之间的关系。近年来社会学在研究范式上出现了一些新的变化趋势,研究方法的整合创新已成为重要发展方向。立足于中国社会学的发展创新,正如陈云松在《当代社会学定量研究的宏观转向》一文中所指出的,基于大数据的“宏观定量社会学”处于当代中国社会学研究转向的前列,对拓展学科疆域和构建中国特色社会学话语体系具有重要意义。

  由大数据带来的这一定量社会学研究转向正在汇成一股强大潮流,不但冲击了传统社会学的研究方式,而且通过研究方法的融合创新正在重塑定量社会研究的范式,从而为社会学研究开辟新的研究领域和方向。因此,我们需要重视大数据开发和利用,通过研究方法的整合创新,促进中国社会学不断发展。

  (作者单位:山东大学社会学系)

责任编辑:张晶
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026