摘要:作为跨学科的一种方式,知识发现和数据挖掘是个多学科综合的领域。它的目标是识别和描述数据模式,向使用者传递有意义的数据模式信息,并运用一系列预测变量和它们的多重组合形式来高度准确地预测结果变量。数据挖掘实际上是知识发现的过程,包括理解问题领域、理解数据、数据准备、数据挖掘、评估新知识和使用新知识等环节,融合了归纳和演绎两种研究方法。该过程不仅回应了“数据为本”、“数据驱动”的误解,且为发现新理论与创新思维提供了新方式,为来自因果关系的挑战提供了新的解决途径。相较于传统社会科学研究方法,数据挖掘更关心对整个事件的完整阐述,利用多元、复杂和细节化的丰富数据,关注因果异质性和多重非线性关系,因此相比传统统计模型能更准确有效地预测解释结果。
关键词:数据挖掘 大数据 知识发现 定量 量化分析 因果关系
作者舒晓灵,美国加州大学戴维斯校区社会学系教授;陈晶晶,美国加州大学戴维斯校区社会学系博士研究生。
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>