庄初升:有序推动客家方言语料库建设
2017年07月28日 07:51 来源:《中国社会科学报》2017年7月28日第1258期 作者:本报记者 李永杰

  原题:有序推动客家方言语料库建设—— 访中山大学华南语言资源与方言文献研究中心主任庄初升

  客家方言不仅是客家人日常交流用语,也是沟通彼此感情、进行身份辨识的工具。客家方言是客家群体的最重要特征,也是研究客家历史文化最重要的依据。近日,记者专访了国家社科基金重大项目“海内外客家方言的语料库建设和综合比较研究”首席专家、中山大学华南语言资源与方言文献研究中心主任庄初升,详细了解了当前客家方言研究的相关情况。

  加强各领域综合研究

  《中国社会科学报》:人们把客家话称为“古汉语的活化石”,请问您怎么理解这一观点?

  庄初升:南方闽、粤、客方言保留着较多古汉语的成分和特点,都有“古汉语的活化石”之称。其实,不论南方方言还是北方方言,都或多或少有一些成分比较古老,也有一些成分比较年轻。即便是像潮州话这样被认为非常古老的方言,也有一些比北京话还要年轻的语言特点,因为任何方言都在发展演变,只不过在时空上常常呈现出不平衡而已。

  《中国社会科学报》:当前客家方言研究现状如何?在您看来主要存在哪些问题?

  庄初升:首先,语料残缺不全和错漏百出,以及语料数字化程度低,是当前客家方言研究裹足不前的一个瓶颈。其次,客家方言分布范围广,内部差异大,此前学术界对客家方言划分的标准不具备历史深度,因此划分结果有悖语言事实。最后,对海外客家群体以及海外客家文献关注不足。过往学术界对客家的内涵和外延不甚了了,一般研究者所理解的客家只限于中心区,对边区及海外的客家关注较少。

  此外,尽管国际上“客家学”已经成为显学,但是客家的社会、历史、文化研究者对客家方言的重视程度不够,而客家方言的研究者也经常忽视客家的社会、历史、文化研究。

  《中国社会科学报》:随着客家方言研究的不断开拓和深入,这一领域出现了很多新的研究课题,请您简要介绍主要体现在哪些方面?

  庄初升:在我看来这主要体现在三个方面:第一,扩大和深化客家方言的田野调查工作和综合比较研究,这是当前面临的最重要、最艰巨的任务。第二,全面开展海外珍藏客家方言文献的搜集、整理和研究工作,这也是当前亟待解决的。第三,有意识地加强客家方言与客家族群、客家文化之关系的综合研究,这是当前及未来相当长时期内需要着重加强的。

  打造开放性的语料平台

  《中国社会科学报》:在您看来,在客家方言语料库建设中应如何合理有效利用现代化数字技术?

  庄初升:在中国语言资源有声数据库工作蓬勃开展的今天,我们有条件也有必要对海内外客家方言的代表性方言点进行有声语料的科学采集、整理和储存,这项工程对于汉语方言研究和应用的数字化基础建设具有重大的学术价值,对于客家方言及客家文化的传播、传承和保护具有重大的现实意义。另外,把共时的有声语料与历史文献语料有机结合起来进行比较研究,可以有效拓展客家方言研究的广度,开辟客家方言史研究的新路。

  大数据时代的语言学,为深入、广泛地开展客家方言的综合比较研究提供了理论武器和技术条件。我们将在已有调查材料的基础上进一步扩大调查的范围和内容,特别加强对赣南、粤北、粤东“本地话”和边区、海外客家方言的田野调查,以及对中西方有关人士编写的客家方言历史文献资料的搜集、整理,建设具有一定规模量级的规范化、标准化“客家方言有声语料库”和“客家方言历史文献语料库”,使之成为一个基础性、集成性、权威性、开放性的客家语料查询和应用平台。

  此外,我们还将以自建的“客家方言有声语料库”和“客家方言历史文献语料库”作为基本依据,实现方言材料全方位的共享利用、多维度的灵活查询和多方言点的纵横比较,使定量研究与定性研究有机地结合起来,力争取得前沿性、创新性的研究成果。

  搜集海内外方言语料

  《中国社会科学报》:据我们了解,您目前正在主持进行国家社科基金重大项目“海内外客家方言的语料库建设和综合比较研究”这一课题,现在课题研究进展如何,取得了哪些阶段性成果?

  庄初升:本课题一共有客家方言的田野调查、客家方言的语料库建设、客家方言的音韵比较研究、客家方言的词汇比较研究和客家方言的语法比较研究五个子课题。本课题开展两年多以来,课题组的主要工作集中在子课题一和子课题二上。

  按照子课题一的研究计划,拟实地调查海内外44个有代表性的客家方言点,辅之以实验语音学的方法,以统一采集标准和技术规范获取第一手翔实可靠的语料。两年多来,课题组已经完成广东13个方言点、江西8个方言点、福建7个方言点、台湾2个方言点以及四川、广西、香港各1个方言点的实地调查工作,整体上田野调查任务已经完成三分之二。目前已经完成任务的每个方言点,都采录了2360个字音、2067条词语和200个句子,包括纸笔记音和专业录音。历史上的州府所在地,如梅县、惠州、南雄、长汀、大余等,还采录了大量的口头文化和长篇语料。

  按照子课题二的研究计划,拟对搜集到的海外客家方言文献加以甄别,选择10—15种文献进行整理,按照一定的技术标准录入计算机并进行精细的标点、校注;聘请数据库专家,指导子课题成员着手建立语料库。一年多来,课题组已经完成了超过200万字的录入、校对。特别值得一提的是,在文献搜集方面也做了不少工作,如在英国剑桥大学图书馆检索并拍摄了《三江土话四大福音书》,这是目前所能看到的唯一一种有关粤北客家方言的文献资料。未来一年课题组将继续录入、校对三到五种具有代表性的文献,全部完工之后,将聘请数据库专家建立“客家方言历史文献语料库”(网络数据库),实现全文本字、词、句的检索、查找功能。

责任编辑:常畅
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院泰达时代中心1号楼11-12层 邮编:100026