2024年10月26—27日,由中国社会科学杂志社、清华大学主办,中国社会科学杂志社哲学编辑部、清华大学出土文献研究与保护中心承办的“中国社会科学杂志社语言学前沿论坛(2024):数字时代的语言学研究”在京召开。来自中国社会科学院、清华大学、北京语言大学等14所高校、科研院所的20余位专家学者就“数字时代的语言学研究”发表见解并进行学术交流。
开幕式现场
开幕式由清华大学出土文献研究与保护中心主任黄德宽主持,清华大学党委常务副书记向波涛、中国社会科学杂志社副总编辑魏长宝分别致辞。
向波涛表示,人工智能作为新一轮科技革命的核心技术,对语言学发展具有重要意义。清华大学作为国内最早研究人工智能的高校之一,长期致力推动人工智能与语言学的交叉融合,希望通过此次论坛,深入探讨人工智能与大数据模型在文科领域的应用,推动数字时代的语言学新发展,为构建中国特色、中国风格、中国气派的语言学学科体系、学术体系和话语体系贡献力量。
魏长宝表示,语言文字事业事关历史文化传承和经济社会发展,事关国家统一和民族团结,在党和国家工作大局中具有重要地位和作用。以大数据、云计算、人工智能等为代表的现代科学技术,推动语言文字的信息化发展,为实现更高效、更便捷的语言文字交流提供了广阔的空间。推进语言文字工作治理体系和治理能力现代化,是全国语言学研究工作者应当承担的重要学术使命。希望各位专家学者围绕会议主题,深入探索语言学研究的新领域、新方法、新成果,共同推动语言学研究的发展和进步。
第一场汇报由中国社会科学杂志社哲学编辑部研究员赵培杰主持。北京语言大学语言科学院教授李宇明梳理了语言伦理与语言研究的关系,重点讨论了数据产业链的伦理问题,提出以向善、向上为核心价值导向的语言数据伦理准则,以指导语言数据伦理的治理。南方科技大学人文科学中心教授李蓝认为传统的语言学研究范式已不能完全适应AI时代大数据、多模态与高科技紧密结合的发展趋势,因此,需要建立AI时代的语言学研究范式。
第二场汇报由北京语言大学语言科学院教授李宇明主持。武汉大学文学院教授赵世举认为“人机会话”为语言学研究带来了新的理论命题,如“机器语言”及相关理论的建构、语言及其功能的再定义等,同时也带来了诸多挑战,因此需要革新治理理念,创新治理模式和路径,全面实施人机会话及相关应用的综合治理。清华大学中国语言文学系教授刘颖认为语言模型作为自然语言处理领域的核心技术,已经展现出强大的语言理解和生成能力,但它们在知识获取和应用上仍然存在局限性。广东外语外贸大学高级翻译学院教授黄忠廉探讨了机器翻译(机译)与人工翻译(人译)的关系、发展趋势及各自的优劣,认为未来人机交互翻译将成为主流模式,机译与人译将共存互补,共同推动翻译行业发展。
第三场汇报由浙江师范大学语言生态研究院教授张先亮主持。浙江大学外国语学院教授刘海涛认为目前的AI时代可称之为数智时代。数智时代的人工智能语言能力飞速发展,对传统语言学构成挑战。因而当前的语言学研究需基于真实语言数据,采用数据驱动方法,挖掘语言的线性规律与系统结构,探究线性词链和二维网络结构的关系,为构建可解释的语言智能体和深入理解人类语言系统贡献力量。澳门大学人文学院教授徐杰探讨了语言学与涉语人工智能的交集,认为虽然人工智能在自然语言处理方面取得了进展,但语言学作为一门独立学科,其价值不应仅以对人工智能的贡献来衡量。他还分析了语言学与人工智能的互补关系,以及人工智能对语言学研究的潜在赋能作用。
第四场汇报由南方科技大学人文科学中心教授李蓝主持。浙江师范大学语言生态研究院教授张先亮讨论了数字时代下的语言生态,他认为这种语言生态表现为物质的多元化、信息的扁平化以及能量的增强化,存在诸多机遇与挑战,需要创新语言生态治理机制,加强生态空间资源保护与推广,进而构建和谐的语言生态。首都师范大学语言治理研究中心教授王春辉探讨了数字人技术对人类语言生活的影响和治理策略。数字人具备强大的语言能力和交互特征,应用场景日益广泛,但也带来理解与响应局限性、方言与口音适应性等挑战。他提出提升数字人能力、适应各类场景、加强法律伦理保护等治理策略,以促成更健康的语言生活。江苏师范大学语言科学与艺术学院教授余光武利用计量风格学方法,分析杨澜、李静、陈鲁豫三位访谈节目主持人的语言风格,构建风格模型,为主持人风格对比研究和AI主播语言风格学习提供新视角和参考。
第五场汇报由广东外语外贸大学英语语言文化学院教授魏在江主持。安阳师范学院甲骨文信息处理教育部重点实验室教授刘永革探讨了将词向量技术应用于甲骨文研究的方法,提出这种方法可进行词义分析、语法分析,同时也可预测卜辞的缺失部分,以此为扩展还可在语义上进行甲骨残片的缀合。首都师范大学甲骨文研究中心教授莫伯峰提出使用多模态大模型对古文字进行研究的方式,通过模拟人类古文字学家在考释古文字时所使用的三种基本方法,即偏旁分析法、字形比较法和辞例归纳法,初步评估了这种发展思路的可行性。清华大学出土文献研究与保护中心助理教授李霜洁提供了一种全新的计算框架,将甲骨文字的朝向与行款建模为结构化的数学表示,使用人工智能与数据科学的计算工具,挖掘甲骨文受“中轴对称”影响产生差异化写法背后的模式和规律。
第六场汇报由首都师范大学语言治理研究中心教授王春辉主持。中国社会科学院语言研究所研究员沈家煊认为应更新汉语语法理论,以适应数字时代的需求。他提出“汉语大语法体系”,强调语言的本质是对话和互动,并以“字”为基本单位,通过“对言格式”构建语法结构。该体系借鉴了国内外语言学的新进展,并具有普遍意义,有望推动语言科学和人工智能的发展。广东外语外贸大学英语语言文化学院教授魏在江以汉语对言构式为例,探讨构式语法与人工智能的交汇点,并强调中国语言学家应加强基础理论研究,构建本土语言学理论,为人工智能发展贡献力量。
第七场汇报由江苏师范大学语言科学与艺术学院教授余光武主持。南开大学文学院教授石锋指出人工智能打破了小语言学、纯语言学的假设,需要建立新的大语言学观念。通过对语言和思维、语言习得等进行考察,他认为人类语言与人工智能语言的根本区别在于人类语言的具身性和个性化,呼吁语言学人反思并适应人工智能时代,探索语言学发展的新方向。南京师范大学文学院教授梁丹丹比较了人工智能与人类语言能力,从人类语言发展历程和多样性的角度分析了机器语言的能力。她强调区分“能力”与“表现”,指出机器语言能力与人类存在本质差异,但机器在语言表现方面仍具有巨大潜力。清华大学人文学院计算语言学实验室教授江铭虎探讨了人工智能与语言学的交叉发展,从大脑的多层级理论到普遍语法,再到深度学习神经网络和大语言模型的诞生,揭示了语言认知与机器学习之间的联系。他还比较了人脑与语言模型在参数规模和数据处理上的差异,指出大语言模型在模拟人类语言理解方面取得了巨大进步。
闭幕式由中国社会科学杂志社哲学编辑部编辑崔晋主持,中国社会科学杂志社哲学编辑部主任莫斌、清华大学出土文献研究与保护中心主任黄德宽分别致辞。
莫斌介绍了近年来杂志社在选题设置上的变化。杂志社注重前沿问题和交叉学科研究,致力于给不同专业的学者提供跨学科交流的平台。本次论坛的主题是在大语言模型飞速发展且影响越发深远的背景下提出的,与会学者面向科学技术前沿、立足中国语言实际,对中国语言学科自主知识体系建构作出了许多有益的探索。
黄德宽指出,本次论坛议题广泛,涉及基础研究、应用层面、伦理生态等多个方面,取得的成效超出预期。在人工智能新的发展态势之下,语言学界既面临挑战,也看到了弯道超车的机遇。就古文字研究而言,清华大学出土文献研究与保护中心准备建立计算古文字学实验室,就是在新形势下紧跟时代发展的尝试。中国语言学理论体系的建构具有得天独厚的优势,我们应该继承传统学术的优点,吸收西方学术的精髓,推进中国语言学的发展和进步。
随数字时代的到来,大语言模型等新科技赋予了语言学研究新的工具、视野和使命,为语言学的未来发展注入了新的活力。同时,语言学与新科技的融合,也使语言学越发深入地参与到科技发展的进程之中。在此背景下,中国语言学既面临挑战,同时也有着弯道超车的机遇。对此,本次论坛聚焦“人工智能与语言学新发展”和“数字技术与汉字汉语研究”两个议题,从理论探索、方法创新、人文关怀、科技前沿、社会现实等多个方面,对语言学研究范式、语言伦理、语言数据伦理治理、语言生态、语言理解和生成、知识获取和应用、人机会话、人机交互翻译、语言的线性规律与系统结构、语言智能体、数字人、汉语语法理论、汉语对言构式、甲骨残片缀合等领域或问题进行了探索,对自然语言处理、大语言模型、数据驱动方法、计量风格学方法、词向量技术、多模态大模型、甲骨文的数学表示等技术或方法进行了关注,对“以向善、向上为核心价值导向的语言数据伦理准则”“汉语大语法体系”“大语言学观念”等概念或理论进行了阐释,为构建中国特色、中国风格、中国气派的语言学学科体系、学术体系和话语体系作出了贡献。
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026
>