机器翻译无法取代人类
2023年12月25日 15:30 来源:《中国社会科学报》2023年12月25日第2801期 作者:练志闲/编译

  本报综合外媒报道 澳大利亚麦考瑞大学应用语言学特聘教授英格丽德·皮勒(Ingrid Piller)表示,语言灵活多样,具有深刻的社会性,而机器算法恰恰相反,因此机器翻译无法取代人类,人类不能因为技术而放弃学习语言。

  随着机器翻译技术不断进步,有些人认为,如果机器能完成翻译工作,人类(尤其是已经掌握英语的人)则不需要费力气学习语言,一些英语国家高校也以此为由取消了语言课程。然而,机器翻译技术还远远无法达到取代人类的地步,而且在可预见的未来也无法做到。

  机器翻译的算法需要大量文本数据进行训练,而文本数据是人工翻译过的平行文本,一般为标准通用语,不包括方言和俚语。然而,多样性是人类语言的重要特点,对机器而言却难以应对。例如,“deadly”在大多数情况下都表示“致命的”,但在澳大利亚,这个词在日常使用中也可以表达“优秀”的意思。例如“deadly awards”表示非常优秀的奖项,如果将其输入翻译软件,只能得到“致命的奖项”的翻译结果。

  除了在同一种语言内部有多样性,不同语言之间的转换也要考虑差异性。例如,时态、数字或性别在某些语言中需要结合语法来处理,而在另一些语言中则不需要。将简单的语句“我是一名学生”翻译成德语,就需要在语法中加入明确的性别,分为“我是一名男学生”或是“我是一名女学生”,这种灵活变化对机器而言是非常困难的。

  机器翻译还存在训练数据不均等的问题。有些语言使用人数众多,有丰富的资源支撑,于机器学习而言,它拥有大量的训练数据,但是还有一些语言未必有丰富的资源支持。英语在大型语言模型的训练数据中占90%以上,其余少部分训练数据由几十种语言构成。训练数据不均等会导致翻译准确性不高问题,最近一项研究发现,机器在将越南语翻译成英语时,有一半问句都被处理成了陈述句。目标语言为英语以外的语言时,输出的文本问题更大,出现了杜撰词汇、语法错误和前后矛盾等问题。

  机器翻译在人类的日常环境中具有一定的用处,但只适用于无风险或低风险的情况。虽然翻译应用程序越来越多地应用于医院等高风险场合,但是医院工作人员会尽可能不使用机器翻译,而是选择与病人进行直接交流,因为机器翻译的结果偏差较大。

  只有人类才能识别低风险或高风险情况、是否适合应用机器翻译、机器翻译结果是否准确。要做出明智的决定,人类就需要了解语言和机器学习的工作原理,在经济、外交或医疗等高风险环境下,人类的语言翻译仍然不可或缺。(练志闲/编译)

责任编辑:张晶
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026