自俄藏、英藏、中藏等大宗西夏文献刊布以来,以研究西夏文文献为主要内容的西夏学迅猛发展,成果大量涌现,引起学界广泛关注。回溯既往研究,对单一(种)文献如西夏文字书《同音》《文海》、西夏文法典《天盛律令》《新法》、夏译汉籍《孙子兵法》《六韬》等的整理与研究占据主流,但综合性、整体性的研究成果较少,以致有学者担忧西夏学研究趋于“碎片化”倾向。随着西夏文文献整理、研究日趋成熟,将不同国家的收藏品系联起来,将世俗文献与佛教文献结合起来,推动西夏学向更高水平发展的必要性日益凸显出来。我们近二十年来一直致力于西夏文文献的整理及数字化工作,对于其学术价值有深刻的体会与认识。
智能识别助益文献深度整理
传世的西夏文文献绝大部分是出土文献,大多有残损,相应的也有数量若干的残页,如英藏黑水城文献即以残片为主。对于保存文字较多的残页,学界多能辨别内容并加以利用,然而还有大量留有只字片语的残页未能确定归属,因而无法得到充分的利用,令人扼腕。近年,敦煌文献的缀合,尤其是敦煌佛典文献在缀合方面取得的成就,展示了出土文献缀合的重要学术价值,也提供了富有启迪性的工作思路和方法。敦煌文献缀合从内容着手,检验以行款、残字、书风、字迹等,成效显著,大量散存于不同国家或地区的文献得以重新拼配起来。但是,这一研究理路对西夏文文献并不完全适用,西夏文残页往往不能确定其内容,西夏文笔画繁复导致字迹厘定等难以确保精确度,实践起来困难很大。那么,西夏文残页的整理还有其他可操作的方法吗?答案显然是肯定的。笔者的研究团队最近一直努力推进基于深度学习的西夏文文献数字化工作,单字的识别准确率已达到90%以上。同样,人工智能技术能够用于西夏文残页的识别、归类工作。采集俄藏、英藏、中藏等中较为完整的文献,在形成完备的文献库基础上,训练神经网络对残片上的文字进行识别和分类,实现基于残片的相关文献检索,为确定残片所归属的文献的可能性提供了支持。此外,俄藏西夏文文献在出土、运输、编目、出版等过程中,很多文献被人为分割编号,借助智能西夏文识别技术以及相关的西夏文自然语言处理方法,也能帮助我们深入窥探文献相互关系中蕴藏的更多原始信息,理清西夏语言的发展脉络。在当今信息技术时代,大数据和人工智能对学术研究的影响力不言而喻,西夏学在这方面还有很大的提升空间。
强化佛教文献和世俗文献比较研究
西夏文世俗文献数量较少,西夏文辞书也有缺佚,导致不少字义、词义存在争议。我们翻译文献时,如果只依据《夏汉字典》等工具书,不广泛联系其他文献,就很难做到信、达、雅。例如,《天盛律令》有“”一词,汉文本译作“匠类”,显然是将“”(匠)和“”(类)汉语对译的简单拼合,不易理解。检阅世俗文献,《类林》中有将“”(儒、才)与“”组合,用来表达“儒生”的意思。将两个例子结合起来看,“类”当是表示某类群体的人,类似于藏文的词缀“rigs”。故而,《天盛律令》中的“”应当意译作“匠人”,代入律文,亦明了顺畅。相比于世俗文献,佛教文献的数量更多,内容更加丰富,具有极高的语料价值。一方面,佛典语料可以覆核世俗文献词语考释的成果。《天盛律令》中有两个常用词——,学者译作“边等”和“边等法”,其具体词义不明。许鹏通过搜集与“”有关的双音节词分析认为,“”是主谓式结构,指出其意为“同等”。由于这种论证方式在此前西夏语词汇研究中尚未使用过,有些学者对新考词义颇有疑虑。最近我们检索在建的西夏文佛教文献语料库,发现其中也有“”。《大般若经》卷三〇一“”,对应汉文“世尊齿相四十齐平,净密根深白逾珂雪,是二十三”,“”对译“齐平”,据此可知,通过结构分析法考证的词义是比较可靠的。另一方面,佛典材料可以增加很多语料,弥补世俗文献之不足。仍以词语为例,《同音》中的双字格等,世俗文献均未见具体用例,而《大般若经》《华严经》《大宝积经》等文献保存了很多相关用例,它们在具体语境中所表达的含义与辞书释义颇有不同,值得研究者进一步关注、整理。至于佛典语料帮助辨析世俗文献词义抵牾的,更是屡见不鲜。可见,加强佛教文献和世俗文献的比较研究,是西夏语言文字研究新的增长点。
细致甄别西夏文献文本
目前研究西夏历史文化最重要的文献是《天盛律令》,克恰诺夫、史金波、聂鸿音、白滨等中外西夏学家先后对其进行了全文翻译。最近几年,不少硕士、博士研究生选择《天盛律令》的某一门、某一卷或者某一类材料,重新进行解读、翻译,在通行汉文本的基础上取得了一些进展,但是由于译者来自不同的高校、没有拟定统一的翻译体例等,难以形成质量高、接受面广的新译文。要改变这一状况,必须组建稳定的研究团队,从字、词、句等具体单位出发确定翻译的基本原则,尤其注意翻译过程中的横向联系和纵向联系。这样完成的译文才是前后一致、易于理解的,也才能发掘出更多的历史文化信息。佛教文献的研究亦是如此,占有少数文献的考证很可能是只见树木不见森林。学界通过佛经序跋的翻译、部分佛经文本的对勘,认为西夏文佛经可以分为初译本和校译本。然而,将大量的夏译汉传佛典结合起来看,这一经典结论还需要斟酌。很多被确定为校译本的文本,还保留有初译本的痕迹(如《大宝积经》),一些大部头经典的部分卷次甚至杂糅着新旧两个时期的内容(如《大般若经》),以致无法简单确认其属于初译本抑或校译本。文本内容的复杂性提示我们,西夏时期译经、校经、抄经的过程具有长期性、复杂性等特点,并非一蹴而就的,这需要根据大量不同经典中的例证进行系统梳理、总结。更为重要的是,这一实证研究关系到西夏佛教史上另一个颇具争议的问题,即西夏时期是否完成了西夏文《大藏经》的翻译或刊刻。如果西夏时期连校经工作都没有完成,那么西夏文《大藏经》的刊行也就无从谈起了。这些疑窦都有赖于佛教文献的整体性研究来证实。
诚然,加强文献的整体性研究是西夏学发展之迫切要求,然西夏文文献毕竟难以检阅,要实现这一研究目标,还需要研究工具的革新,即开发类似于汉语语料库那样的西夏文文献数据库。唯有运用成熟的数据库,才能实现研究资料的高效、快捷检索,文献的整体性研究方成为可能。我们目前建立了基于方正系统的西夏文世俗文献数据库,并编撰出版了《西夏文词典(世俗文献部分)》(中国社会科学出版社2021年版),佛教文献部分的语料库也正在加紧建设之中。考虑到西夏文佛教文献数量之浩瀚,其数据库的建设还有赖于学界同仁的共同努力。
(本文系国家社科基金重大项目“西夏文《天盛律令》整理研究”(17ZDA186)阶段性成果)
(作者单位:陕西师范大学历史文化学院)
友情链接: 中国社会科学院官方网站 | 中国社会科学网
网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号
中国社会科学杂志社版权所有 未经允许不得转载使用
总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市东城区王府井大街77号C座2-5层 邮编:100006
>