大数据赋能古籍活化
2023年05月16日 09:41 来源:《中国社会科学报》2023年5月16日第2650期 作者:刘忠宝

  党的二十大报告强调,“增强中华文明传播力影响力。坚守中华文化立场,提炼展示中华文明的精神标识和文化精髓,加快构建中国话语和中国叙事体系,讲好中国故事、传播好中国声音,展现可信、可爱、可敬的中国形象”。中华民族自古以来都十分重视对文献的收集、整理、保存和研究,古籍文献成为传承中华优秀传统文化的重要载体。大数据等数字技术的发展与应用,为古籍资源挖掘与古籍活化利用带来了更多可能。新时代新征程,我们要充分发挥大数据驱动古籍活化的研究优势,加快构建中国话语和中国叙事体系,积极主动地讲好中国故事、传播好中国声音,为全面建成社会主义现代化强国营造有利的外部舆论环境。

  大数据为古籍活化赋能,开辟出一系列新的领域:古籍语义化表示、历史人物画像、历史场景还原、古籍故事叙述等。大数据驱动的古籍语义化表示,需要解决古籍数字资源整合与古籍文本语义化表示的问题。古籍数字资源整合的有关研究,主要探讨古籍数据库的集成方法和古籍数据模型,以及古籍知识库的深度融合方法。古籍文本的语义化表示的有关研究,则着重探讨古籍文本标注问题和古籍文本向量化表示问题。大数据驱动的历史人物画像,探讨历史人物画像与历史人物关系网络构建问题;研究融合历史人物画像的网络表示学习方法,并尝试将该方法应用于历史人物关系分析;引入文献循证法,以此提高历史人物关系分析的准确性。大数据驱动的历史场景还原,主要是挖掘古籍文本中的历史事件及组成要素,并建立历史事件画像和历史场景画像。如何在历史人物画像的基础上,分析历史人物与历史事件的关系,建立历史事件画像和历史场景画像,是历史场景还原研究需要解决的关键问题。一方面,该研究根据叙事学基础理论,引入深度学习模型,构建历史事件画像,并结合情节定义,分析情节与历史事件网络模型的映射关系,建立历史事件情节与本体;另一方面,该研究还根据情节的时序特征,建立历史人物—历史事件关系网络,并借助关联分析技术,找出影响历史场景的关键因素,融合历史人物画像和历史事件画像,构建历史场景画像。大数据驱动的古籍故事叙述,根据历史人物、历史事件、历史场景三类画像的结构特征,对这三类画像的融合问题进行深入探讨。古籍故事叙述面临两大问题:一是如何生成历史故事,二是如何叙述历史故事。利用深度学习模型,建立古籍故事生成模型,可以描述史实的核心内容;围绕视觉叙述和文本叙述,引入自然语言处理和可视化技术,建立古籍故事叙述模型,可以实现古籍的多维度故事生成和全景式故事展示。

  根据时代特征和现实需求,可以从资源、技术、服务、文化主体的视角,探索大数据赋能古籍活化的实现路径。资源视角下,鉴于社会对以古籍数字资源为主要载体的传统文化具有差异化需求,需要建立以需求为导向的古籍数字资源建设体系。技术视角下,在大数据驱动以及现代传播理论支撑下,传统文化与时代接轨呈现新的样态,建立面向古籍活化的数字技术体系是其未来发展的必由之路。服务视角下,为丰富服务内涵、提高服务质量和水平,需要引入以古籍活化为核心的智慧化服务模式,建立智慧化、立体化、全景式的古籍活化智慧服务体系。文化主体视角下,鉴于古籍活化的时代感和前瞻性,有关理论、技术、方法、平台从提出、接受到落地,需要联动多方主体释放规模化推广效益。

  (作者单位:北京语言大学语言智能研究院) 

责任编辑:张晶
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026