耿海英:科学合理地使用引文分析
2018年04月03日 08:08 来源:《中国社会科学报》2018年4月3日第1424期 作者:耿海英

  在人文社会科学研究领域,说起引文,我们常常会想到社会科学引文索引(SSCI)、艺术与人文科学引文索引(A&HCI)和影响因子。引文索引设计的初衷,是通过文献之间的引证关系提供一种文献检索方式。但其建设有一个遴选来源期刊的过程,所以期刊是否被其收录被许多人作为期刊评价的一个依据。其实,引文索引作为一种数据源,为多种层次的引文分析提供了不可或缺的数据基础,而影响因子可谓是引文分析中的一种简单数量统计。

  目前,国内一些科研管理部门简单地将引文索引和影响因子用于学术评价尤其是对研究人员个人的评价。这种现象在学界尤其是在人文社会科学领域备受争议。这种现象的产生,归根结底是对引文索引工具和引文分析方法认识的不足以及对它们的不合理使用或滥用。

  正确认识引文分析的功能

  所谓引文分析(Citation Analysis),就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。引文分析的基本功能是揭示科学和学科结构。根据基本功能,引文分析可应用于以下领域:描述科学、学科发展,判断科学、学科的运动和革命,识别新的发展趋势,为科研管理、学科建设服务;追溯科学发展史,跟踪学科发展轨迹;为信息检索和文献情报服务提供检索点、检索途径和可视化界面;为学科分类、期刊分类、文献分类和学术共同体的划分提供工具与方法;为科研评价、学科评价、期刊评价、人才评价等提供参考。由此可见,将引文分析用于评价只是其基本功能的延伸。从具体做法来看,引文分析可以分为两种类型:引文描述性统计分析和引文网络分析。

  引文描述性统计分析,是对大量的引文数据进行统计分析并总结规律,是相对简单的引文分析。统计内容包括引文年代分布、引文数量分布、引文类型分布、引文语种分布、引文国别分布等。论文的被引频次是引文描述性统计分析中涉及最多的研究内容,它所反映的是论文在其领域内的影响力,经常被用于评价论文质量。以论文的被引频次为基础,通过统计期刊前两年发表的论文在统计年被引用总次数和该刊前两年内发表的论文总数,就能计算出期刊的影响因子。由此可见,影响因子描述的是期刊刊载论文的篇均被引用的情况。引文描述性统计分析是引文分析中相对简单也是应用比较广泛的一种,经常被用于各种评价实践中,如期刊评价、人才评价、项目评价等。

  文献引用和被引用的相互关系形成了链、树、网型结构,即科学引文网络。引文网络主要有直接引用网络、文献耦合网络和文献共被引网络三种类型。目前,引文网络分析主要被图书情报学界应用于自然科学,以揭示科学结构或科学发展规律,而人文社会科学领域的应用相对较少。

  注重人文社会科学的特色

  引文描述性统计分析固然能揭示出科学文献的一些规律,引文网络分析则可以得出更深层次的有意义的结论。然而,引文网络分析在人文社会科学领域的应用却并不顺畅。究其原因,人文社会科学有其自身的研究特点和文献使用特点。

  人文社会科学的研究对象往往具有民族性和地域性特点。人文社会科学内部,人文科学与社会科学之间以及文学、历史学、哲学、政治学、经济学、教育学、法学等具体学科领域之间,从研究对象到研究方法又存在许多差异。人文社会科学研究具有成果多样性和引文的长周期性特点。不同的学科领域,科学交流的渠道和方式也有较大差异,具体表现在科学出版物类型和文献使用方式等的差别。人文社会科学更加重视专著、政府报告或咨询报告等,期刊论文通常并不是主要的学术研究成果。所以,在人文社会科学领域尤其是人文科学领域学术研究成果交流中,图书扮演着重要角色。对于人文社会科学领域的研究者而言,经典学术著作更受重视。在某些人文学科领域,引文不仅包括专著、预印本、报告等非连续出版物,还包括一些非学术型文献,如报纸新闻、政治言论等。而且,这些学科领域的引文年限一般都比较长,在哲学、历史学等学科中这种情况尤其突出。

  图书虽然是人文社会科学研究领域使用率最高的文献形式,但是相对于比较完善的期刊引文数据库,图书引文索引库建设却严重滞后。已有的图书引文索引库也不成熟,存在较多的问题,将其应用于引文分析还有很多工作要做。

  科学使用引文分析任重道远

  作为一种分析方法,引文分析在被应用于人文社会科学研究领域时,应根据人文社会科学领域研究特点和文献使用特点,同时综合引文分析理论中新的方法和工具,从而实现科学合理使用。具体来讲,可从以下方面着手。

  选择合适的引文数据源。基于引文分析研究与评价的质量、合理性和可靠性,这种方法很大程度上依赖于所用引文数据的准确性和全面性,不准确或不全面的数据往往造成不准确甚至错误的结果。SSCI和A&HCI作为引文数据库,其所收录的期刊在国别地区、学科及语种等方面也不均衡,收录我国刊物的数量更是有限。所以,基于它们来研究或评价我国的人文社会科学难免偏颇。而结合我国自建的中文引文数据库则是比较明智的选择。同时,考虑到人文社会科学文献引用特点,综合使用期刊引文索引和图书引文索引,会大大提高人文社会科学学术成果的覆盖面,从而较为准确、全面地反映人文社会科学研究现状。

  引文描述性统计分析与引文网络分析相结合。引文描述性统计分析是最简单而基础性的引文分析,也是更深层次引文分析的前提。引文描述性统计分析,可从数量方面测定学科的影响力和重要性,研究学科情报源分布,确定核心期刊,研究学科交流和情报传递规律,研究文献老化和情报利用规律,研究情报用户的需求特点,以及进行科学水平和人才的评价等。而引文网络分析则从引文间的网状关系揭示学科的动态结构和某些发展规律。比如,可以通过文献共被引网络了解某学科的知识基础以及研究前沿,通过著者共被引网络发现科学共同体等。

  综合其他方法。科学引文网络具有一定的社会网络特征,因此社会网络分析尤其是整体网络分析中的一些模型和方法,可以移植或经过改进后引入引文分析中。目前,社会网络分析主要用于研究科学合作网络。同时,随着文本挖掘技术的提升以及全文本获取的可行性,基于文献全文的引文内容分析越来越多。引文内容分析就是从论文的内在特征出发,从施引文献的客观文本中抽取被引文献的主题内容,有利于揭示出施引文献和被引文献之间的创新关系以及被引用原因,进而更有效地展现学科领域的演化过程。在引文分析结果展示方面,信息可视化技术的发展提供了更形象的图谱化展示形式。

  引文分析结果与专家研判相结合。引文分析结果尤其是图谱化的结果,提供了学科领域知识的线索。但是,由于自身经验、领域专业知识等方面的局限,分析人员可能出现分析缺乏深度、难以透彻解读图谱等情况。这时,我们就有必要借助领域专家的智慧,结合专家的知识经验与判断能力,对结果进行更加准确的判读和评估。

  (作者单位:中国社会科学评价研究院)

责任编辑:张月英
二维码图标2.jpg
重点推荐
最新文章
图  片
视  频

友情链接: 中国社会科学院官方网站 | 中国社会科学网

网站备案号:京公网安备11010502030146号 工信部:京ICP备11013869号

中国社会科学杂志社版权所有 未经允许不得转载使用

总编辑邮箱:zzszbj@126.com 本网联系方式:010-85886809 地址:北京市朝阳区光华路15号院1号楼11-12层 邮编:100026