数据库揭示语言多样性及其进化
2022年06月20日 09:38 来源:《中国社会科学报》2022年6月20日第2430期 作者:王俊美/编译

  本报综合外媒报道 6月16日,每日科学网报道称,来自德国马克斯·普朗克进化人类学研究所等机构的语言学家、计算科学家和心理学家,共同创建了“词汇银行”这一全球语言数据存储库。该数据库包含2000多种语言的标准化词汇数据,有助于人们深入了解当今世界各地语言的词汇和声音进化状况。

  世界上是否有很多种语言都用类似“mama”和“papa”的词汇来表达母亲和父亲?各种语言如何设法使用较少的词汇来表达更多的概念?该数据库的形成,可借助计算方法研究此类语言问题。马克斯·普朗克进化人类学研究所语言与文化进化系教授拉塞尔·格雷(Russell Gray)表示,该数据库的灵感来自美国国家生物技术信息中心建立的DNA序列数据库——“基因银行”。基因银行中有大量可免费获得的数据,这彻底改变了学者分析生物多样性的方式,而“词汇银行”也将以类似的方式,改变人们对语言多样性的认识。

  该数据库借助软件工具,极大地优化了语言学家的工作流程。计算机辅助工具使现有语言数据集更具可比性,显著提高了数据标准化和数据管理的效率。此外,研究人员还通过计算技术回答有关语言多样性及其进化的问题。例如,在语言数据标准化的基础上,很容易检索有多少种语言使用“mama”和“papa”来表示母亲和父亲。事实证明,类似的特征存在于世界上不同语言和不同地区中,且不同的语言之间并无关联性,这反映了语言独立的平行进化过程。

  新的数据库及其自动计算的语言特征,为人们提供了关于语言多样性、语言进化等开放性问题的新见解。在调查哪些语言使用同一词汇来表示“手臂”和“手”时,研究人员发现,使用同一词汇来表示“手臂”和“手”的各种语言,通常也使用相同的词来表示“腿”和“脚”。这表明,与单一语言相比,将人类语言的词汇作为整体研究时,往往更具结构性。

  (王俊美/编译)

责任编辑:崔岑
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026