李蓝:汉语方言调查技术取得历史性突破
2018年09月14日 09:12 来源:《中国社会科学报》2018年9月14日第1537期 作者:李蓝

  1915—1926间,瑞典著名汉学家高本汉陆续发表了他的代表作《中国音韵学研究》。这部书不仅是中国现代音韵学的开创之作,也是中国现代汉语方言学的发端之作。中国学术界同仁惊喜地看到,现代汉语方言的调查研究不仅可以使我们了解到方言的地理分布和共时差异,还可以根据这些差异来重建汉语的历史。时任中央研究院历史语言研究所所长的傅斯年先生认为,“以后我们的汉语学不得不以方言的研究为成就的道路……我们现在要于汉语学的致力,左也是方言,右也是方言”。他拟订了具体的方言调查计划,陆续延揽了赵元任、李方桂、罗常培等著名语言学家。在这些语言学家的努力下,现代科学意义上的汉语方言学迅速发展壮大,为中国现代语言学的百年振兴奠定了坚实基础。其中,赵元任先生的贡献尤其重大。在方言调查领域,赵元任先生发明了记录汉语声调的五度制标调法,完善了方言调查字表和方言语音的记录方法,创立了词汇、句子、长篇语料的记录方法,组织领导了六次方言调查,写出了《现代吴语的研究》(1933)、《钟祥方言记》(1939)、《湖北方言调查报告》(1948)等系列经典著作,正式确立了汉语方言学的调查研究范式。

  从赵元任开始,使用《方言调查字表》等调查材料到田野实地调查,调查结束后整理调查材料,撰写调查报告或科研论文,成为汉语方言调查的规范操作程式。上述工作环节中,整理调查材料花费的时间最长,工作最为辛苦。通常情况下,把一两个月的调查材料整理成可发表的调查报告,需要数年时间。以《湖北方言调查报告》为例,开始调查的时间是1936年5月5日,结束的时间是5月21日。实际调查的时间只有半个月。但《湖北方言调查报告》到1948年才正式出版,材料整理的时间长达12年。其间虽然有战乱因素的影响,但把笔写的音标符号整理成音系,整理古今对比关系表和排同音字表,做词汇对照表,根据录音转写长篇语料,绘制方言地图,这一系列繁复的工序和流程才是历经12年才把调查材料整理成书的原因。

  到20世纪50年代全国汉语方言普查时,虽然丁声树和李荣设计了可反复使用的记音卡片,但以人工排同音字表和古今对比关系表来对比方言之间的异同,仍是极其繁琐的事情,稍不留神就会出错。即使是曾被美国语言学同行誉为“永远不会错”的赵元任先生,在方言材料整理中也曾留下过遗憾。

  计算机技术是人类有史以来最伟大的发明创造之一,尤其是在数据库和统计计算能力方面,早已远超人脑。因此,从20世纪90年代计算机技术开始普及以来,一直有人试图把计算机在数据处理方面的优势移植到方言材料整理上,做得比较多的是各种整理方言同音字表的软件。有的软件还可以排音系表,可以作古今对比等。但经我们试用,就已有的功能看,这些软件排的同音字表和古今对比表都不规范,不能直接使用。此外,软件的用户体验也很差,动辙死机崩溃,与专业软件的差距很大。此外,这些软件功能也很少,一般只能用来做同音字表,方言学界常用的古今对比,多方言比较,排声韵调、排音节表等功能都不能实现。而且,这些软件都只能用于整理调查材料,不能用于田野调查。

  有鉴于此,笔者于2005年申请到中国社会科学院语言研究所的一个所级项目,计划开发一款专业软件,以期全面模拟方言调查过程,并用于田野调查记音和即时整理调查材料。2007年,“中国社会科学院语言研究所方言处理系统” 1.0版完成。此版本的软件集成了《方言调查字表》3810个字音的数据库,配备了记音界面,可以用来记单字音,并即时生成同音字表,可以做古今对比关系表以及声韵调完全配合的音节表。2013年,笔者申请到国家社科基金的资助,结合语言研究所甘肃方言调查的创新项目,对这个软件做了大规模的升级更新,前后升级了17次,版本从1.0版升到9.0版。利用这个软件,课题组顺利完成了甘肃全省的汉语方言调查任务,并初步完成了甘肃省92个调查点的材料整理工作。

  该软件重要功能包括如下方面。

  其一,设计了多种数据导出导入方式。软件既可以把一个方言的全部数据一次性打包导入导出,还可以对单字音、连读、词汇、语法例句、长篇语料进行分项导入导出。导入导出时还可选带录音或不带录音数据导入导出。这个功能特别适合多人合作的团队项目。团队不同成员在不同地方调查记录,结束后即可上传给项目负责人,及时分享数据,及时解决调查中碰到的问题。

  需要着重指出的一点是,利用软件的数据转移功能,可以大幅度减少调查时间,节约经费。具体做法为:由于邻近方言的差别很小,当记录了一个方言后,就可以把这个已记音的方言材料导入到新的调查点中。因为是用已记好音的方言来对照需要记录的新方言,这时只要对已有记录数据稍作修改即可,不必重复全部记音工作。用这种方法,熟练的调查者只需两天就可以调查一个方言并全部录好音。

  其二,设计了符合田野调查实践的记音界面及多种快捷记音方式。在单字记音界面上定义了七个快捷记音键,不必重复记音。在记录连读、词汇、句子或长篇语料时,可以根据原来记的单字音,自动为已有的汉字匹配音标,从而实现了自动记音功能。

  其三,设计了多种录音播音方式,可以自动做语图。而且,所有录音文件都自动切分并与记音数据相关联,当点击记音符号时软件即播放录音,这样就可以审核原来的记音是否准确到位。

  这也是一项革命性的技术创新。原来纸记笔录记下来的方言调查材料,使用者都无法核实记音,无法验证其记音的准确性。利用我们的软件,不但可以核查方言调查者的记音水平,如果记音水平达不到专业要求,使用者还可根据录音材料重新记音。

  其四,软件提供了多种修改功能,可以一次只修改一个字音,也可以批量修改某一类声母、韵母或声调,甚至可以在播音界面上根据录音来修改原来的记音。

  其五,软件功能强悍而且鲁棒性达到专业水平。这个软件现在可以做六种同音字表,可以自动做同音字表、多方言的连读对照表和多方言的词汇对照表,在最近一次升级中,软件新增了词典编写功能,可以自动完成全部词语的字音提取和方言词语的首字音序,还可以做方言词语的笔画排序。而这些工作原来不但要花费大量人力物力,还不容易保证质量。如今在这个软件中,这些工作只消轻点鼠标即可迅速完成。

  其六,由于软件中的所有数据在录入过程中都经过了数据化处理,把这些数据导出后,可以直接导入到地理信息系统软件的数据库中,对其做分区分类、地图绘制等更深层次的数据加工处理。

  甘肃汉语方言调查在汉语方言调查史上有重要的开创意义。这次调查,首次做到全软件、无纸化对所有调查材料进行录音。对甘肃方言四年多的田野调查,核验了这个软件,提升了这个软件。这个软件也为甘肃方言的调查工作提供了强大助力。

  通过甘肃方言调查研究的实践,我们确信,我们为汉语方言工作者提供了一个功能强悍的软件,汉语方言调查研究技术取得了历史性的重大突破。

  (作者单位:南方科技大学人文科学中心、中国社会科学院语言研究所)

责任编辑:刘远舰
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026