周建设 张文彦:智能时代的语言学研究
2018年09月14日 09:10 来源:《中国社会科学报》2018年9月14日第1537期 作者:周建设 张文彦

  1956年,“人工智能”概念首次在达特茅斯会议上提出,至今已有60余个年头。中国工程院院士李德毅认为,人工智能是“探究人类智能活动的机理和规律,构造受人脑启发的人工智能体,研究如何让智能体去完成以往需要人的智力才能胜任的工作,形成模拟人类智能行为的基本理论、方法和技术,所构建的机器人或者智能系统,能够像人一样思考和行动,并进一步提升人的智能”。当今中国,传统的人口红利、劳动红利正逐渐消失,劳动工具正在向基于数据、信息、知识、价值和智能的智力工具转化。

  今天,语言文字事业已成为关系国家核心利益的重要因素,不只与国家经济、文化、科技发展紧密相关,甚至会直接影响到社会的和谐稳定与国家的综合安全。语言能力也已经成为国家综合实力的重要组成部分之一。如何在智能时代特色下开展语言学研究,是当今语言学者无法回避的问题。

  人工智能影响语言学研究

  在人工智能席卷社会各个领域的技术浪潮下,语言学也无法置身事外。如何做到让计算机真正理解自然语言,精准分析语言内部语法语义层次结构,实现从语言表面形式结构到内部意义的合适映射等问题不仅引起了语言学者的深思,同时也激发了计算机科学、数学等领域专家的极大兴趣。

  自然语言处理与自然语言理解作为人工智能的四大内涵之一(脑认知基础、机器感知与模式识别、自然语言处理与理解、知识工程),和语言学有着不可分割的密切关系。然而,从20世纪七八十年代开始,自然语言处理的研究方法出现了根本性的转变,从以语言学提供的形式理论和计算方法为主转向以基于统计方法的研究为主。人工智能领域的相关工程技术人员普遍认为,不论是多么前沿的语言学理论,在实际的自然语言处理中也起不到多少实际作用。在这种观点的影响下,作为计算机的重要信息处理对象,自然语言因为其自身的特殊性逐渐被工程技术人员淡化。

  半个世纪以来,语言学家们过于关注语言本体相关领域的研究:注重语法/语义相关规则的抽取,热衷于从一类语言现象出发来描述语言对象的性质,寻找解释范围更广的语言规律;某种程度上忽视了除语言符号本身之外的其他非语言本体知识的作用,也忽视了具体的语言使用个例。

  人工智能引领语言学研究

  人工智能时代下,科技更迭迅速,引领社会飞速发展的同时也不断催生各种与语言相关的需求。人工智能领域学者逐步开始关注人类学习语言的过程,研究热点涉及底层逻辑构建、规则专家系统、深度学习、自然语言理解等。这其中,规则系统、自然语言理解等方向的进一步发展都需要语言学家给予相关理论、知识、资源和专业技术等层面的支持。

  语言学研究应做到找准自身优势,更好地和自然语言理解等人工智能技术深度融合。要实现人工智能的终极理想——机器真正理解自然语言,仅靠目前自然语言处理领域取得的工程上的进步尚远远不够。因此,语言学研究前进的方向要充分体现智能时代的特征,以大数据为支撑,凸显智能化优势,以服务国家战略为最终目标。

  大数据为语言学研究提供支撑

  正是由于互联网的广泛普及,大规模语言数据的生成成为可能,以统计方法为主导的自然语言处理研究才逐渐成为主角。

  智能时代,语言资源比以往任何时候都更为丰富,也更容易获得。在强大的计算能力和科学统计模型的双重辅助下,蕴藏在海量鲜活语言样本中的规律就有可能被挖掘出来。基于大规模数据概括出的语言规律更加符合实际使用情况,不仅能够增强自然语言处理能力,同时也对语言学理论研究产生了促进作用。反之,语言学研究也可以充分利用人工智能已有的研究成果,在构建大规模语言工程的同时检验既有语言学理论,联合自然语言处理相关领域。

  人工智能为语言学研究提供便利

  在大规模数据的基础上,语言学研究不但要有数据、模型,还需要充分发挥人工智能技术手段、多学科深入互动等智能化优势,结合人工智能研究热点,从认知角度入手,深入挖掘、探索语言学研究新领域。

  智能时代背景下的语言学研究应该在加强心理学、神经科学、脑科学、认知科学等多学科研究深入互动的前提下,把注意视角从语言本身转向语言的实际使用规律、语言背后的语义及其组合机制等领域。

  基于统计方法的自然语言处理研究虽然取得了显著的进展,但在深层语义理解等问题面前仍然束手无策。近年来,计算语言学等人工智能领域将语义分析中的指代、隐喻、情感分析等研究方向作为突破口,以解释自然语言处理过程中的语义理解等问题。越来越多的人工智能学者和语言学者意识到,真正解决语义理解问题,还是要依靠传统语言学的理论成果,单纯依靠统计方法无法继续取得跨越性的突破。

  人工智能特别关注脑认知技术、技术感知、自然语言理解、知识共享等领域的研究。主要有如下几个方向:以机器理解为主的自然语言理解相关理论研究,以认知模式为基础的新型语义学研究、语用学研究等。未来,在“智能科学与技术”的迅猛发展中,研究将由知识工程走向认知工程,以语言为中心,聚焦于脑认知的研究和利用,语言学者可以在人工智能已有成果的基础上深入发掘,结合人工智能技术优势,提升语言学研究成果的应用价值。

  语言学研究要服务国家战略

  今天,语言已成为重要的战略资源,各国通过培养专业人才、增强资源储备、提高分析技术等途径来实现国家语言实力的提升。西方国家不仅使用语言输出、语言分析等手段来进行文化侵略和情报搜集,而且开始在全球范围内开展语言竞争,从政治、经济、文化、安全等关系国家安全的各个领域渗透入侵。

  从人工智能领域来看,我国可侧重于应用层面的开发研究,在自然语言处理等领域弯道超车,争创世界领先。这一重要战略举措将有利于中国在新一轮人工智能全球竞争中抢占先机,迅速占领人工智能新技术的战略高地。

  智能时代的环境下,语言学与其他学科的交叉融合拥有了更便捷的技术条件和学科优势。语言学研究应该突破传统禁锢,开阔思维视野,不仅在研究内容上要有新的拓展,在研究方法上也要紧跟时代步伐,充分利用众多学科的前沿理论成果。语言学家既可以沿用传统方式去挖掘有理论价值的语言事实,给出详尽合理的解释,也能够针对大数据技术手段,挖掘、整理海量语言数据知识,并将这些知识应用到自然语言处理等人工智能领域中。

  语言学家不仅可以通过自己的努力为人工智能提供理论和实践等角度的建议,也应该更加主动关注、主动对接国家战略,以服务国家战略为目标,凸显智能化特点,突出实用取向,顺应提升国家语言能力的重大现实需求,在人工智能高速发展的浪潮下,走出更加实际的语言学研究之路。

  (作者单位:首都师范大学语言智能研究中心)

责任编辑:刘远舰
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026