中国社会科学杂志社

首页>中国社会科学报>科学与人文

史红：大数据促进美学研究发展

2018年10月16日 09:20 来源：《中国社会科学报》2018年10月16日第1553期作者：史红

　　在数据技术（Data Technology,DT）时代，大数据已成为创新与竞争的驱动力。数据技术的成熟促使数据爆发性、指数级地增长，形成海量规模，无法使用传统尺度衡量、计算。据统计，2012年以来，全球数据总量年增长率维持在50%左右，到2020年全球数据总量将达到40ZB左右。数据类型呈现结构化、半结构化和非结构化的多样态，数据来源广泛而复杂，有源于各种传感器、测试仪器、模拟实验室、相关企业的数据，也有源于个人数字终端的社交网络、搜索引擎、网页浏览记录等。大数据对各行各业提出了挑战，对美学亦是如此。大数据给美学研究与传播提供了新方式、新视角、新路径，蕴含极大价值，既带来了良好的发展机遇，同时也带来了强烈的冲击震荡。

　　大数据对美学存在多重影响

　　1.就研究思维而言，大数据引发美学研究的思维变革。大数据既能处理“因果关系”又能处理“相关关系”，即不仅能够回答“为什么”还能回答“是什么”。如迈尔-舍恩伯格和库克耶在《大数据时代》一书中所言，大数据给我们思维的启示是“首先，要分析与某事物相关的所有数据，而不是依靠分析少量的数据样本。其次，我们乐于接受数据的纷繁复杂，而不再追求精确性。最后，我们的思想发生了转变，不再探求难以捉摸的因果关系，转而关注事物的相关关系”。传统美学研究思维主要探究美的本质与现象间的因果关系，现在要开启全新思维范式，培养、树立大数据意识，在因果性之上还要重视事物的相关性、混杂性，以复杂性思维推进美学研究的现代化。

　　2.就研究模式而言，大数据带来美学研究的模式转变。当下大数据研究新模式是继实验科学、理论科学、计算科学之后出现的第四种研究范式，即“数据密集型科学发现”（Data-Intensive Scientific Discovery）模式，研究者运用数据挖掘工具进行统计与计算，揭开数据背后的谜底。以往传统美学研究先以某种理论假说推断审美现象，再收集证据来验证假说。而运用数据分析研究，可以不断修正美学研究的抽象理解，从审美现象的相关性上加深对美的本质认识。用数据说话将成为美学研究常用模式之一。当然，如果仅仅是对数据分析，没有思辨说明、因果分析，也会存在数据堆砌的嫌疑。

　　3.就研究深度而言，大数据推动美学研究的纵深掘进。大数据对解读人的审美行为、美感等规律提供了技术基础、机遇。以往，我们对美感研究主要依靠问卷、访谈、实验等方法，美感的神经运动一直被认为是很难观测的。当代神经美学证实对人物特写的审美欣赏刺激了梭状回的“面部区域”，对风景画的审美欣赏则刺激了海马旁回的“方位区域”。神经科学解释了神经元通过突触传递信息的原理，有关上千神经元的同步活动数据被显微镜观测到。另外，对美感的研究可以借鉴在线文本情感的分析技术，如通过计算机软件精确识别海量文本中语言所表现出的情感。人的审美情感是多样的，愉悦也有程度差异。我们可以建立美感数据库，利用大数据挖掘技术，对美感进行分类、匹配，从而捕捉人的美感特征。大数据架起了美学理论与实证研究的桥梁，实验获得的相关性数据，可以为美学理论提供实证证据，使美学定性与定量研究相辅相成。

　　4.就研究精度而言，大数据提高了美学研究的准确程度。美学学科性质决定了美学研究的抽象性、模糊性，难以使用数量化、模型化予以表现。同时，美学研究多采用有限的小样本个案方法进行推理，研究者较多主观感觉、理解与判断。大数据可以改变美学研究有限数据的质量，较为清晰地呈现美学各种复杂关系，逐渐揭开模糊的审美问题迷雾，提高美学研究的科学性。

　　5.就研究空间而言，大数据拓展美学研究的疆域范围。DT时代的小样本个案研究会趋向于大数据研究，如对唐诗的研究，有学者运用大数据技术对5万首唐诗进行深度文本分析，发现了唐诗中出现频率最高的词、描写最多的季节、最多的情感。一些美学与艺术问题都可以通过统计分析、数据挖掘等手段进行分析。如大数据可以分析不同艺术家的风格倾向，形成用于识别个人风格的“艺术家指纹”；分析审美思潮的历史演变，艺术中心历史迁移等变化；分析美学研究文本的主题、意图、关键词等，丰富内容含量。大数据使美学研究空间得以拓展。

　　6.就研究设计而言，大数据校准美学研究的选题设计。大数据对美学研究有关选题进行量化处理，可发现空白的、薄弱的、亟待解决的研究领域或时代方向、研究热点等，帮助学者更有针对性地进行课题设计，使之准确对焦。比如，现在有机构对2018年国家社科、教育部社科立项的哲学学科高频关键词研究发现，“主义”“批判”“康德”“表征”“新时代”“情感”“思想”较多。这些大数据使我们对美学研究状况有更多的了解，也激发我们研究灵感、触发研究动机。

　　大数据算法决定研究结论

　　大数据实质是一种技术分析方法，使用怎样的算法就会涌现出怎样的结论。大数据的算法模型主要有如下4种。

　　1.关联规则挖掘（Apriori）。它是挖掘关联规则的频繁项集算法，力图寻找两个或两个以上变量的取值之间存在着强相关关系规律。如典型的啤酒与尿布之间的关联关系。美学研究可以借这一算法寻找两个因素之间的相互关系。成都研究团队采用大数据的方式，挖掘破译唐诗中的成都元素，寻找出了成都与唐诗的关系，发布了《成都打开唐诗之门》等研究成果。

　　2.聚类挖掘（K-means）。它是将研究对象的集合分成相似的对象集，相似度测度、聚类准则和聚类算法是其中的三要素。相似度测度主要用于衡量对象类似性和差异性，以分辨对象同类或异类的类别性质。聚类准则用于评价聚类结果，聚类算法用于找出使准则函数取极值的最好聚类结果。现在有机构对2018年国家社科、教育部社科的立项学科进行聚类研究发现，立项最多的是管理学，立项最少的是港澳台问题研究，聚类数量相差145倍。这启示美学研究课题也可以选择聚类挖掘模型进行分析，观测 “热门课题”“冷门课题” “一般课题”的不同数量。

　　3.序列模式挖掘（Sequential pattern mining）。它是“序列数据库中挖掘那些支持数超过预先定义支持度的序列模式的过程”，要找出序列数据库中所有超过最小支持度阈值的序列模式。这是基于有序的数据集来挖掘出现频率高的序列的分析，通过计算每个频繁序列的序列模式值，然后按照序列模式值的大小对挖掘结果重新排序，使之能够找到最重要的序列模式。在商业运用上，如国外研究机构挖掘出《婴儿指南》与婴儿车的因果关系的序列。将序列模式挖掘引入美学研究，可以挖掘诸如美学某一关键词的频繁点击模式，这一关键词在不同文档序列里出现模式；挖掘哪些因素在某一类审美体验中会频繁出现等。

　　4.时间序列模式挖掘（time-stamp）。它是研究某一指标在不同时间上的不同数值所排成的顺序数列，寻找前后时刻的数值或数据点的相关性，提取与时间属性相关的信息、内容，挖掘出时间序列的周期规律、振幅与趋势性。其建模方法主要有一元时间序列、多元时间序列、离散型时间序列、连续型时间序列。时间序列模式挖掘的重要应用价值是对现象、活动、事件等的预测，通过编制的时间序列所反映出的发展过程、规律、方向与趋势，预测未来情形。比如，卡诺夫运用“蒙特卡洛模型”的算法分析出一部电影在一万种情况下的表现。美学界可以将大数据作为一种预测和分析的工具，为美学研究、发展提供一种有效的参考模型。我们可收集与整理审美现象、审美活动等的历史资料，按照时序排成数列，从中找出审美现象、审美活动伴随时间变化所呈现的规律。如挖掘审美思潮时序、当代美学热点、美学会议议题聚类等所存在的规律、特点与影响因子等。

　　大数据使美学科学化

　　从研究者关系上说，数据的共享、聚合使得美学研究从个体独立研究更加趋于团队的合作、协同研究。从研究能力上说，大数据要求美学研究者能够运用大数据技术处理美学信息，分析这些信息所蕴含的意义。面对浩如烟海的数据，美学研究者对它们进行分类、梳理、归纳、分析，从中挖掘出有价值的美学内容，可能将变成更为重要的工作。大数据技术对美学研究的意义在于提高研究的科学性、精确性与针对性，在修正内容的片面化、零散化、浅表化等层面提供现代方法论支持。

　　大数据让美学抛却对简单的因果关系的分析，而在整体意义上实现对复杂审美现象的宏观认知，描绘出一幅审美世界的整体图景。当然，我们也应意识到大数据对美学并非只有优势而无弊端。大数据易于发现美学问题，但不能合理解释问题；研究者易于关注数据分析方法，但易忽视思辨方法、推理方法。另外，若过于强调大数据，也会落入 “技术中心”的陷阱。如何消除这些弊端，发挥好大数据价值，是值得我们仔细深究的问题。但无论如何，DT时代已经来临，美学的转型与变革成为必然，美学研究应紧跟时代潮流，不断突破、创新。

　　（作者单位：首都师范大学政法学院）

责任编辑：张月英

重点推荐