在社会科学领域与大数据、人工智能结合的交叉性研究得到学术界和工业界广泛认可的同时,复杂系统中新的研究问题、研究方法及研究趋势成为该领域学者继续探索的议题。清华大学社会科学学院主办、清华大学社会网络研究中心承办的第三届社会计算国际会议以线上线下相结合的方式成功举行,与会专家学者围绕复杂研究、社会计算等主题进行了学术报告与交流。会议旨在跟踪领域前沿性研究,促进社会科学、计算机科学、统计学等领域的深度融合与创新。
多维融合复杂、大数据与社会计算研究
复杂、大数据与社会计算的融合研究是目前该领域的前沿性交叉研究,包括ABM(Agent-based modeling)方法、网络表征与动态建模、基于微观数据进行模拟仿真构建社会理论、组织行为的复杂演化研究等。
其中,关于复杂研究和主体建模结合的方法,纽约大学Joshua Epstein分享了基于神经认知基础Agent-Zero的生成性社会科学研究。Agent-Zero是一个具备精确性和可计算性的主体,其包含情感性、有限理性和社会性三个模块,内部模块之间的交互产生了可观测的个体行为,多个主体间交互可产生集体动态,如冲突、社会心理和法律。研究基于多主体进行模拟仿真实验,设置了逃跑、突袭、拒绝免疫等行为,恐惧学习率、记忆窗口和阈值等参数,该方法可被用于从生成性社会科学的视角解释社会规律。
在网络动态的研究和表征中,法兰克福金融管理学院Jan Nagler分享了网络模体(motifs)影响主体反应动态的研究。反应时间可以量化一个摄动传导到达给定网络动态类型中网络节点的速度,其中网络动态类型包括节点的自动态、节点之间的连接性、两个节点之间的交互动态。通过随机模拟实验表明,对于带有模体的网络而言,当存在多种模体类型或有限网络行为时,计算传播反应时间的数学框架应该同时考虑枢纽节点的渐进区和传播路径的模体;若网络中存在大量行为,则需要考虑拓扑独立性中的自动态指数和节点之间的临近动态。
基于微观数据构建社会理论,乔治梅森大学Robert Axtell分享了在数据泛滥情况下社会科学导航——基于公司数据建模整体经济的研究。该研究基于美国公司税收记录的微观数据,发现了劳动生产率、员工流动网络、城市规模等对公司产生影响的规律。由于目前已有理论难以解释数据呈现的现象,研究基于计算主体的方法进行模拟仿真,最终产生出公司规模分布、公司增长、员工流网络等拟合曲线。其中,模型成分包括异质性代理、规模收益递增规则、主体间信息流动网络等,模型参数包括偏好分布、补偿规则、邻居节点数等。研究建议在目前综合微观数据可用性增强的背景下,在数据指导下构建模型,可发展出下一代可解释微观数据的社会理论。
在组织行为复杂演化方面,清华大学罗家德及高馨分享了在组织变革中提升团队创新能力的研究。该研究基于探索性研究和验证性研究结合的方法论,使用某大型互联网公司中3万名员工组成的3000多个团队在2014—2018年五年内的数据(包括员工项目参与记录、参与课程培训数据、面试记录数据等),勾画了团队内合作网络、团队间合作网络、课程交流网络等。探索性研究主要基于机器学习和可解释AI的方法,验证性研究主要通过提出研究假设,进行因果分析或回归分析,得出结论后再形成推论。探索性研究结果是:2014—2018年,持续较大影响团队创新的因素是团队间合作网络的外部连接数、新员工的知识多样性、团队内部合作网络的密度等。验证性研究中提出的假设除验证了上述的探索发现外,还包括了雇佣具有异质性知识的员工调节团队对外联结以提升团队创新的能力,同时在动态演化的不同阶段,影响团队创新能力的因素也略有不同,平时较需要人员稳定,变革期则更需要拥有异质知识的新成员加入。研究假设通过回归模型均验证通过。
除了上述复杂演化下的大数据研究之外,北京化工大学谷伟伟分享了网络的隐藏几何空间和最优嵌入维度的研究,得克萨斯农工大学Xinyue Ye分享了构建地理信息科学中知识图谱的方法,中央财经大学杨虎分享了基于融合投资偏好的图神经网络进行头部风险投资机构识别的研究,浙江大学吴超分享了基于群体智能的社会计算科学,伦斯勒理工学院Oshani Seneviratne分享了社会计算和区块链结合的研究。
通过前沿技术方法提升学术关怀
随着社会科学领域中大数据研究的日益成熟,社会计算领域的学者更多地聚焦于如何通过前沿的技术方法提升本领域的学术关怀。南京大学陈云松分享了计算社会学视野下定量社会分析宏观转向的相关研究,包含基于大数据进行宏观因果分析、社会结构呈现、基于非监督学习进行宏观理论助产、基于监督学习进行隐形指标测量四个方面。哥廷根大学傅晓明基于11392名学习者在线学习过程中的行为数据和个人社会经济地位特征数据,分析了个体社会经济地位指标对课程参与和学习效果的影响,并通过构建机器学习模型,分析了影响学业成绩的重要因素。中国科学院王飞跃介绍了新舆情时代社会处方和社会医院的概念。
大数据在带来众多研究突破的同时,也带来了一定的风险和问题。电子科技大学周涛分享了在线导航中的信息茧房问题,华盛顿大学Aylin Caliskan围绕负责任的AI(Responsible AI)研究了机器智能中由于训练数据存在人类的偏见而导致其具有存在或扩大人类歧视偏差风险的问题,伦敦玛丽女王大学Gareth Tyson分析了滥用社交信息平台的问题,复旦大学陈阳分享了在线社交网络中恶意账号检测机制的研究。
此外,技术方法层面的研究也受到该领域学者关注。清华大学刘涛雄介绍了在经济学领域将因果图应用于变量选择的方法,卡内基梅伦大学Simon DeDeo研究了基于关系链进行行为解释的问题,清华大学刘知远探讨了基于符号和嵌入性的两种不同的文本表征方式、图神经网络及其与社会科学领域结合的研究。
基于各类大数据进行数据挖掘和理论洞见,依旧是学者们研究的重点。芝加哥大学James Evans探讨了科学界的创新是如何被扼杀的,香港中文大学(深圳)贾建民研究了新冠肺炎疫情期间人们数字生活方式的变化和差异,香港中文大学黄波评估了新冠肺炎疫情防控中通过控制物理距离和接种疫苗产生的联合效应,清华大学何晓斌研究了“五险一金”在中国劳动力市场中的角色,江苏科技大学周斌基于数据统计分析和社交网络结构分析研究了信息传播规律。
(作者单位:清华大学社会科学学院社会学系)
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市东城区王府井大街77号C座2-5层 邮编:100006
>