“定性大数据”研究改善公共政策制定
2020年01月08日 08:47 来源:《中国社会科学报》2019年1月8日总第1853期 作者:本报记者 王悠然

  2019年12月,美国企业研究所发布报告《美国家庭日记:民族志研究能否协助公共政策?》。该报告收录了使用民族志观察、深度访问等定性研究方法考察贫困和社会流动受阻原因的最新研究,并探讨了如何借助定性研究改善公共政策制定。本报记者围绕定性与定量研究方法的特点及其在社会科学和政策研究中的应用等问题采访了有关学者。

  政策研究经历两次革命

  美国企业研究所经济政策研究员阿帕尔娜·马瑟(Aparna Mathur)和美国巴克内尔大学社会学与人类学助理教授詹妮弗·M.席尔瓦(Jennifer M. Silva)谈到,在美国,关于贫困和社会流动性的政策研究主要采用高度依赖大规模代表性调查和行政数据的定量研究方法。定量研究关注有关人们的信念和行为的大量且多样化的信息组,并旨在从中归纳出变量之间的数字关系以预测未来行为。

  据美国约翰斯·霍普金斯大学经济学教授罗伯特·A.莫菲特(Robert A. Moffitt)介绍,过去50年里美国社会科学研究特别是政策导向研究发生了两次数据收集和分析革命。第一次革命是大规模、具有人口代表性的家庭调查的发展,如当前人口调查和国民健康访问调查,它们收集了数百项关键的社会经济变量信息,样本规模足够大,能够较准确地估算总人口层面的统计数字和关联。结合家庭面板调查(在不同时间点对相同的样本家庭进行多次访问),这些调查彻底改变了研究人员对低收入美国人的就业、收入、家庭结构、迁移动态的了解。

  第二次革命是大规模计算技术和大容量存储能力的发展,这使数据的高速下载、存储、分析成为可能。个体层面的家庭调查与快速分析方法的结合创造了人们预料之外的海量知识积累。与此相关的还有社会实验和随机控制实验的兴起。社会实验的提议源自20世纪六七十年代美国计量经济学家盖伊·H.奥卡特(Guy H. Orcutt)等人针对负所得税的研究。随机控制实验需要大规模数据收集、大规模样本、合适的计算方法,是考察针对低收入人群的社会政策有何影响的重要工具,通常被认为能够提供对某一政策的真实因果效应的最佳评估。

  定量与定性各有优劣

  美国佛罗里达州立大学高等教育成功中心创立主任、高等教育讲席教授胡寿平告诉本报记者,定量、定性以及定量定性混合研究方法是社会科学研究的基本方法。定量研究方法被普通大众和许多决策者视为更具科学性和客观性的方法,定性研究方法则不得不花费时间和精力去为其科学性和价值辩护。总体来讲,定量研究方法更适用于较成熟的研究领域,它对研究假设的验证较为直接有力;定性研究方法对于人们知之较少的研究领域较有价值,它有利于产生研究假说。定量研究方法有利于验证因果关系或产生一般性、普遍性的结论,定性研究方法有利于对独特个体和独特现象的理解。定量和定性研究方法在人文社会科学领域都有较为广泛的应用,但也因学科学术传统和具体研究问题而异,还受到研究目的、时间资源、研究经费等因素影响。一般而言,小规模研究项目倾向于采用定性和定量方法中的一种,大规模且有较充足经费支持的项目倾向于采用定量定性混合研究方法。

  胡寿平表示,政策制定的优劣取决于所用证据的严谨度、科学性、综合性、匹配性。定性研究方法强调当事者的观点、感受、经历,也较为关注脆弱群体,对政策制定的合理性有积极作用,但由于当事者受限于自身的利益、眼界、目标,在一些情况下有必要批判性地解读和利用定性研究。定量研究中与脆弱群体相关的结果可能被数据中的“大势”掩盖,定性研究则能弥补这方面的缺陷。在政策评估中,定量方法可帮助建立或否认因果关系,定性方法可帮助进一步理解因果关系存在与否的原因。总之,各种研究方法均有其优点和不足,应对具体研究问题、目标、资源和时间环境等因素综合考量。

  大数据催生“定性大数据

  大数据的兴起和迅速流行深刻地影响着科学研究进程。胡寿平说,随着数据收集渠道和能力的迅速扩张以及计算能力的提升,大数据成为定量研究的一个热门领域,这对定性研究或多或少会有影响。公众可能会更相信大数据和定量研究方法的科学性和实用性,从而忽视定性研究方法的合理性和贡献,决策者也会更倾向于以大数据和定量研究发现为决策基础而忽略定性研究结果。大数据为定量研究方法的更广阔应用创造了条件,两者显得更加“适配”,但定性研究方法的目的、优势、适用领域不会因此而过时或消失。相反,定性研究可减少基于大数据的定量研究给脆弱人群造成的负面后果。当然,由于资源有限,大数据的流行也许会使传统定性研究项目更难获得资源支持。

  英国爱丁堡大学社会学教授琳恩·杰米森(Lynn Jamieson)和英国经济与社会研究理事会国家研究方法中心研究员萨拉·卢思韦特(Sarah Lewthwaite)提出,定性研究的一个不足是耗时较长,研究者个人甚至团队难以快速处理大量的定性数据。传统的、严格的分析方法要求研究人员在一定程度上“沉浸”于数据中,即使有软件的辅助,仍需花费较长时间。这一问题激起了社会科学家对大数据的兴趣以及采用定量方法分析量化数据组的偏好,进而催生了将定量研究的宽度与定性研究的深度结合起来的“定性大数据”。

  据胡寿平介绍,“定性大数据”指大规模多角度地应用定性研究方法收集和建造的定性数据库,是与基于数量化的大数据并生的一个新概念。它的优势是大规模、多角度、全方面地观察理解系统内成员的互动以及系统和个体之间的互动,为更全面地理解个体、组织、系统和政策影响创造了条件。

  马瑟和席尔瓦表示,定量研究的根本目标包括普遍适用性、效率、可复制性、透明度,这与新兴的大数据“不谋而合”——大数据分析的目的是让数字“自己说话”,以无偏见的方式展示和预测人类行为模式和趋势。尽管量化数据组规模持续扩大并覆盖更多的人类经验领域,数据分析技术也越来越高速和复杂,社会科学研究人员和公共政策专家对定性研究的兴趣不减反增。

  定性研究以“发现逻辑”为基础,尝试以被研究者的视角看待世界,目的不是证明或证伪有关行为驱动因素的某一理论,而是从人们在日常生活中创造并分享的意义系统出发提出新理论。马瑟和席尔瓦强调,研究人员“浸入”被研究者的生活是为了揭开驱动其行为、指导其决定的“意义世界”,挖掘出量化数据显示的人口学模式的驱动机制。在大数据时代,研究人员应寻求以最优方式运用所有研究方法,填补现有知识的空白并提供更好的政策参考,而非执着于某一种方法。

责任编辑:王宁
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026