【摘 要】为了明确特征因子在期刊评价中的作用,本文采用统计学方法比较特征因子与其他文献计量学指标在期刊评价中的一致性,同时分析特征因子与这些指标间的关系。结果发现在期刊评价过程中,特征因子与标准特征因子一致性最强,与总被引频次有较强的一致性,与影响因子、论文影响分值和影响因子百分位一致性不如总被引频次。虽然特征因子能从施引期刊的质量来评价期刊影响力,但在对期刊进行评价时,特征因子不能取代其他期刊评价指标,应综合利用各评价指标。
【关键词】特征因子;影响因子;总被引频次;论文影响分值;影响因子百分位
如何对期刊进行客观、有效的评价,一直是科学界一个引人入胜的话题。期刊评价是文献计量学研究的重要组成部分,它通过对学术期刊的发展规律和增长趋势进行量化分析,反映期刊的学术水平和影响力,推动学术期刊内在质量的提高。传统的文献计量指标包括影响因子、总被引频次、篇均被引频次及论文下载量等。其中,影响因子(IF)作为期刊评价的重要指标,被广泛应用于评价国内外文献学术影响力,为文献计量学的发展带来了一系列重大革新,为优化学术期刊的使用提供重要参考。然而,随着对文献计量学的深入研究以及影响因子的实践发展,相继暴露出影响因子统计年限不足、计算方式简单、无法跨学科比较等问题。在传统期刊评价指标基础上,特征因子、h指数等被提出,基于引证分析的学术影响力评价指标不断趋于合理、完善。
特征因子(Eigenfactor)是原汤森路透科技集团于2009年推出的《期刊引用报告》增强版中在传统期刊评价指标影响因子和总被引频次的基础上增加的重要文献计量指标,包括特征因子分值(Eigenfactor Score)和论文影响分值(Article Influence Score)。任胜利根据其英文词根,将其翻译为特征因子。与影响因子所不同的是,特征因子不仅将引文数量作为参考标准之一,同时还引入了期刊的影响力,即期刊越多地被高影响力的期刊所引用,则其影响力越高!吕一川。特征因子使用汤森路透集团的JCR为数据源,构建剔除自引的期刊5年引文矩阵,以类似于Google评价网页重要性的PageRank算法,计算期刊的权重影响值,实现引文数量与质量的综合评价。本质上,特征因子是通过构建最早由Price提出的期刊引文网络模型,利用网络分析方法,特别是描述节点重要性的特征向量中心度方法来评价期刊的重要性。
2015年,原汤森路透旗下的知识产权与科技事业部在原有期刊计量指标的基础上又发布了两个新的文献计量学指标,一个是标准特征因子(NEI),一个是期刊影响因子百分位( JIFP )。在众多的期刊评价指标中,如何正确使用Eigenfactor?Eigenfactor与其他期刊评价指标间的关系?不同的期刊组间这种关系是否具有一致性?这些问题在学术界目前都缺乏关注,本文将比较Eigenfactor与其他指标间的关系,同时分析不同期刊组间这种相关性是否一致,以便更准确地了解和反映Eigenfactor在期刊评价中的作用,同时也能更好地应用该指标。
1 方法
1.1 数据来源
本文的文献计量学数据来源于2017年Web of Science收录的全部8849种自然科学期刊和中国179种自然利一学期刊,主要分析Eigenfactor与期刊影响因子、总被引频次、论文影响分值、标准化特征因子和期刊影响因子百分位之间的一致性和相关性,讨论Eigenfactor与其他评价指标在期刊评价中的利与弊。
1.2 统计方法
采用SPSSI3.0,Pearson相关性对8849种全球自然科学期刊和179种中国自然科学期刊的Eigenfactor与其他文献计量学指标进行相关性分析。由于部分期刊某些计量学数据缺失,为了统计的严谨和准确,分析过程中剔除无法获得数据的期刊。
影响因子作为目前公认的重要的期刊评价指标,虽有诸多缺点,但其重要性不容置疑。将8849种期刊按照影响因子由高到低排序,按照前100种期刊、中间100种和后100种期刊进行分层抽样,进一步分析Eigenfacto:在不同的区间段与各指标间的相关性,从相关性反映Eigenfactor与其他各指标在期刊评价中的一致性。
2 结果
2.1 Eigenfactor与其他文献计量学指标的统计学特征
表1为不同组期刊以及中国期刊Eigenfactor、标准化Eigenfactor、总被引频次、影响因子、论文影响分值和期刊影响因子百分位的中位数,从表1中可以看出我国期刊的多项评价指标低于全球指标的中位数,总体处于中下水平。
表1 不同期刊文献计量学指标的中位数
期刊分组(按影响因子由高到低排列) | Eigenfactor | 标准化Eigenfactor | 总被引频次 | 影响因子 | 论文影响分值 | 期刊影响因子百分位 |
全球8849种期刊 | 0.002 725 | 0.313 230 | 1 632.5 | 1.6 570 | 0.526 | 48.9 265 |
8849种的前100种期刊 | 0.062 730 | 7.197 655 | 24 089.5 | 20.2 345 | 9.297 | 98.9 675 |
8849种的中间100种期刊 | 0.002 745 | 0.315 950 | 1 921.5 | 1.6 570 | 0.513 | 48.4 450 |
8849种的后100种期刊 | 0.000 070 | 0.008 520 | 105.0 | 0.0 780 | 0.024 | 1.6 925 |
我国179种期刊 | 0.002 155 | 0.246 550 | 065.50 | 1.2 040 | 0.290 | 39.0 845 |
2.2 Eigenfactor与其他指标的相关性分析
运用统计学方法分析全部期刊、抽样期刊和中国期刊的Eigenfactor与标准化Eigenfactor、总被引频次、影响因子、论文影响分值和期刊影响因子百分位的相关性,结果见表2。从结果可以看出,Eigenfactor与标准化Eigenfactor完全呈正相关,因此在期刊评价过程中的一致性最强;与总被引频次之间的相关性也很高,但是与其他三个指标之间的相关性就相对较弱。我国期刊的Eigenfactor与影响因子、论文影响分值和期刊影响因子百分位的相关性强于全球期刊。
表2 在不同论文期刊分组中Eigenfactor与其他统计指标的Pearson相关系数
期刊分组(按影响因子由高到低排列) | 标准化Eigenfactor | 总被引频次 | 影响因子 | 论文影响分值 | 期刊影响因子百分位 |
全球8849种期刊 | 1 | 0.929 | 0.389 | 0.418 | 0.253 |
8849种的前100种期刊 | 1 | 0.984 | 0.230 | 0.398 | 0.099 |
8849种的中间100种期刊 | 1 | 0.899 | 0.022 | 0.226 | 0.224 |
8849种的后100种期刊 | 1 | 0.620 | 0.142 | 0.450 | 0.113 |
我国179种期刊 | 1 | 0.877 | 0.610 | 0.635 | 0.489 |
为了更直观地了解不同组间Eigenfactor与其他指标的相关性是否一致,笔者对Eigenfactor在不同期刊组与总被引频次(图1)、影响因子(图2)、论文影响分值(图3)、期刊影响因子百分位(图4)进行比较分析。结果发现,Eigenfactor与总被引频次具有较好的相关性,这种相关性在不同组间具有较好的一致性,但是从分层抽样结果可以看出不同的组间仍有差异,影响因子越靠前的期刊其Eigenfactor与总被引频次的相关性越强。不同期刊分组中Eigenfactor与期刊影响因子、论文影响分值相关性弱于总被引频次,与影响因子的相关性在中国期刊组强于其他组,与论文影响分值的相关性在后100种期刊中最高。结果还表明,Eigenfactor与期刊影响因子百分位相关性最差,与标准化Eigenfactor完全正相关,在各组间这两组数据均具有较强的一致性。

图1 不同期刊分组中Eigenfactor与期刊总被引频次相关性的比较

图2 不同期刊分组中Eigenfactor与期刊影响因子相关性的比较

图3 不同期刊分组中Eigenfactor与论文影响分值相关性的比较

图4 不同期刊分组中Eigenfactor与期刊影响因子百分位相关性的比较

图5 不同期刊分组中Eigenfactor与期刊标准化Eigenfactor相关性的比较
3 讨论
本文在已有研究的基础上通过分析Eigenfactor在不同期刊分组中与其他文献评价指标的相关性表明,与Eigenfactor相关性最强的指标是标准化Eigenfactor,几乎完全正相关,并且在不同组间具有很强的一致性。这是因为,标准Eigenfactor是对Eigenfactor的进一步优化和改进的期刊评价指标,是在特征因子基础上设计的,计算方法是用期刊的特征因子除以同学科其他期刊特征因子的均值,因此两者相关性强。在期刊评价过程中,标准特征因子能够弥补特征因子对于“差”期刊的区分度较弱的问题,尤其是在评价排名靠后的期刊时,由于数据离散程度较低,特征因子的区分度较差。
与特征因子有较好相关性的指标是期刊的总被引频次,但在不同的期刊分组这种相关性之间存在一定的差异。从图1可以看出,影响因子越高的期刊其总被引频次与特征因子的相关性越好,由于特征因子充分考虑引文的来源并在计算中赋予不同施引期刊的引文以不同的权重,因此影响因子越靠前的期刊其施引期刊质量越高,而影响因子越靠后的期刊其施引期刊的质量可能高低不等。
Eigenfactor与期刊影响因子和论文影响分值的相关性弱于总被引频次,在不同的组间与每个指标的相关性又存在差异。期刊影响因子以所有引文重要性等价为前提,期刊越多地被引用则其影响力越高,其强调的是期刊被引用的次数,而Eigenfactor强调的是引文的质量,两者互为补充,对期刊引文的“质”和“量”进行评价,两者联合应用能更全面地对期刊质量进行评估。由于特征因子对发文量有明显的依赖,论文影响分值是作为特征因子的补充,排除了期刊载文量的影响,使低载文量期刊的影响力也能很好地被体现出来。由于Eigenfactor、影响因子和论文影响分值从3个不同的方面对期刊进行质量评估,因此三昔之间相关性巨不强。
为了改善影响因子的偏性分布特征和离散程度,2015年6月18日,原汤森路透旗下的知识产权与科技事业部发布的《期刊引证报告》增加了期刊影响因子百分位来优化影响因子。作为影响因子的优化指标,影响因子百分位与影响因子一致性高,因此与影响因子相似,影响因子百分位与Eigenfactor没有明显的相关性。
本研究还对Web of Science收录的179种中国自然科学期刊与其他期刊作对比,虽然Eigenfactor与其他评价指标之间的相关性与所有收录期刊相比具有较好的一致性,但也存在一定的差异性。同时由表1可以看出,我国期刊各指标的中位数均低于收录期刊的中位数,说明我国自然科学期刊总体还处于中下水平,我国期刊的质量与全球期刊之间存在明显差异,需要不断提升期刊整体质量,才能创办国际一流期刊、实践科技强国的发展战略。
4 结语
本文结果表明,标准化Eigenfactor在弥补Eigenfactor不足的同时能够很好地替代Eigenfactor对期刊进行评估,总被引频次能够与Eigenfactor互为补充,从“量”和“质”的层面对期刊进行评价,影响因子、论文影响分值与Eigenfactor是期刊评价的三个互相独立的不同指标,三者联用对期刊评价更加完整和全面。期刊影响因子百分位是影响因子的优化指标,可以在期刊评估中作为影响因子的补充。