业内信息

论文作者数与被引频次关系的再思考

2019-10-11 来源:《情报杂志》
  【作 者】王黎明:浙江工商大学杭州商学院;张啸岳:西北师范大学经济学院;俞立平:浙江工商大学统计与数学学院

  【摘 要】[目的/意义]关于论文作者数与被引频次的关系研究,学术界得出的研究结论大相径庭,有必要继续进行探索。[方法/过程]以《图书情报工作》2015年发表的论文为例,综合采用独立样本t检验、回归分析、分位数回归研究了作者数与被引频次的关系。[结果/结论 单作者论文与多作者论文的平均被引频次没有显著差异;作者数虽然与被引频次正相关,但由于拟合优度太低,所以作者数对被引频次几乎没有影响;作者数与被引频次之间并不存在非线性关系;对于低被引频次的论文而言,作者数对被引频次的弹性更大,由于拟合优度太低,这种规律的体现并不显著;建议学术期刊影响力评价中取消平均作者数指标;该文提供了一种研究作者数与被引频次关系的系统研究范式。

  关键词:论文作者数;被引频次;分位数回归;独立样本t检验;期刊评价

  0 引言

  作者合作与论文被引次数的关系是个传统问题,但也是一个颇具争议的问题,学术界的研究结论并不一致。一些研究认为科研合作能否提高论文的影响力,但也有一些研究认为科研合作与论文的影响力无关,甚至呈现负向影响。由于研究对象、时间跨度、科研合作形式、国家地区等因素的影响,加上研究方法的多样性,这增加了科研合作与论文影响力关系的复杂性,有必要重新进行梳理和深度分析,并建立新的研究范式。本研究对于厘清论文作者数与影响力的关系,丰富相关研究方法,提高学术评价的科学性均具有重要意义。

  关于科研合作对学术质量及影响力的作用机制,Gazni et al.[1]指出合作研究除了分享和传递跨学科知识,还可以将研究者联系在一个大的科学网络下,激发创造力,加快研究进程,增加论文的可见性,扩大研究的影响力。Wagner[2]研究发现,随着科学技术的快速发展,学科高度分化、交叉与融合,新技术、新方法、新设备不断涌现,而资源和设备的缺乏,以及学科分类的不同等,则成为科研人员跨学科、跨机构和跨地域合作研究的主要动因。Bidault et al.[3]认为合作研究是学科专业化的结果,并且往往具有创新性。刘俊婉[4]认为不同科学家个体进行科学合作是一种智力互补,能够充分发挥不同合作者的特长和优势。

  关于论文作者数与被引频次或科研绩效的关系,一些学者持肯定态度。Glanze let al.[5]研究发现,文章被引用次数与合著者的数量有关,跨国合作论文被引用的次数是国内合作论文被引用次数的2倍。Leimu et al.[6]通过对生态学论文的研究发现,4个共同作者的平均引用率高于3个、2个或1个。Beaver[7]研究发现,在一些学科中,科学合作与高研究绩效有着相对显著的正向相关性。Puuska et al.[8]对合著规模进行研究,发现合著人数与论文的被引频次之间存在正相关性。Kaur et al.[9]对印度医学机构的产出研究发现,国际期刊上刊载的国际合著论文比在印度本国期刊上刊载的更容易被引,且在高被引论文和国际合著论文之间存在正相关关系。Abramo et al.[10]证实了国际合作论文在被引频次或所发表期刊影响因子方面要优于非国际合作论文。段宇锋、刘俊茹[11]采用主成分回归方法,分析生物学、物理力学、地质学三个学科期刊的11个特征与期刊被引之间的关系,发现期刊载文量、全国比重、作者数、机构数、引用期刊数等特征对期刊被引有较强的贡献度。陈淑娴[12]研究认为,期刊的作者数量与影响因子成正比。肖学斌、柴艳菊[13]基于Pearson相关系数,研究发现作者人数、页码数、参考文献数和文摘长度与被引频次呈正相关。何汶、刘颖等[14]对图书情报学领域国际顶级1%论文研究认为,合著出版不仅跨界趋势明显,而且有利于提升论文的影响力。

  另外一些研究认为论文作者数与论文影响力无关或者负相关。Glanzel[15]指出,“合作总能确保成功冶不过是一个神话。Bornmann et al.[16]对化学论文的研究发现,合著规模与论文被引频次之间并无明显关联。Duque et al.[17]对三个发展中国家的科学家进行研究,发现合作与科研绩效并无相关关系。Glanzel et al.[18]将国际合著论文被引绩效低于领域平均水平的现象称之为“冷链现象冶。Giovanni et al.[19]对意大利科技论文的研究发现,作者数量与以影响因子代表的期刊声誉之间的并不存在正相关关系。Avkiran[20]以金融学文献为研究对象,发现合作对于研究质量并未产生正向影响。王卫、潘京华等[21]研究发现,合作度、合作率、合作系数与作者科研生产力、科研影响力之间没有必然关系。

  还有一些研究认为论文作者数与影响力关系比较复杂,高自龙、范晓莉[22]研究发现,在经济学、管理学、社会学和人文地理学等社会科学学科中,合作论文某些指标水平确实优于独著论文;在哲学、外国语言文学以及马克思主义理论、法学、图情档学科中,合作论文的个别指标水平低于独著论文;其余学科中,合作论文与独著论文水平基本持平。刘雪立、徐刚珍等[23]对《眼科新进展》的研究发现,4-6位作者的论文被引率和篇均被引频次最高,作者数多于7个的论文,篇均被引频次反而低于4-6位作者的论文。钟镇[24]以9种Web of Science农业经济与政策类期刊论文为例,研究结果显示,合著论文确实具有较高的研究绩效,2-3人的合著是最常见的合作形式,但是在代表各期刊最高研究水平的极高引论文中,高合著规模论文极少,独著论文却占有一定比例,反映出合著规模与合著绩效的不确定性。

  从现有的研究看,关于科研合作对学术论文的作用机制,现有的研究比较成熟,普遍认为科研合作有助于科研成果。但是关于科研合作对学术论文的影响力研究,学术界的研究结论并不一致。有些研究认为科研合作能够提高论文的影响力,但也有些研究认为科研合作与论文被引频次无关,或者呈现一些非常复杂的情况,比如作者数较多或者很少的论文,也能取得较大的被引频次。总体上,在以下方面有待进行深入研究:

  第一,一些研究是针对不同学术期刊的,因为不同学术期刊的论文平均质量不同,导致其影响力也不相同,因此研究时如果能采用同一种学术期刊,可以排除不同期刊论文平均质量不同的影响。

  第二,从研究方法看,现有研究得出研究结论的方法包括:简单统计及绘图分析、回归分析、相关分析、主成分回归等多种。简单统计及绘图分析的研究结论一般没有进行统计检验,部分相关分析也没有进行统计检验,两种情况下的结论均不具有可信性;主成分回归是首先提取主成分,如果论文作者数所在的主成分通过了统计检验,并且回归系数为正,就说明作者数与被引频次正相关,这是值得商榷的,稳健性不够。

  第三,即使采用回归分析,要说明作者数与被引频次的关系也需要两个因素,第一是回归系数的符号以及其是否通过统计检验,第二是拟合优度的大小,即使回归系数通过统计检验,如果拟合优度太小,那也不能说作者数与被引频次关系有多大。

  基于以上原因,关于作者数与被引频次关系结论的多样性应该能够大致进行判断。也就是说,由于样本选取或研究方法的瑕疵,可能会得出一些错误的结论。此外,作者数量与被引频次之间可能存在非线性关系,这方面的研究也比较薄弱。本文拟综合采用独立样本t检验、回归分析、分位数回归等研究作者数与被引频次之间的关系,并对截至到目前的研究结论不一致做一个相对系统全面的解释。

  1 研究框架与研究方法

  本文的研究框架如图1所示,关于被引频次与作者数量的关系,应该从统计学视角与回归视角两个角度同时进行分析。第一是基于统计学视角,最直观和最重要的就是分析单作者论文的被引频次与多作者论文的被引频次有没有显著的差异,方法可以采用独立样本t检验。第二是基于作者数与被引频次的关系视角,从两个方面展开,一方面是对作者数与被引频次关系进行回归分析,看其弹性系数是否通过统计检验,同时引入作者数的2次项,分析作者数与被引频次之间是否存在非线性关系;另一方面是采用分位数回归研究不同被引频次下,作者数对被引频次的弹性系数是否存在显著差异,进一步分析其中可能存在的规律。



图1 研究框架

  2 研究数据

  本文选取《图书情报工作》为例进行研究。该期刊是2015年以来图书馆情报与文献学CSSCI期刊中载文量最大的,样本量较大。此外该期刊在CSSCI核心期刊、北大核心期刊、中国社科院核心期刊等多个学术期刊排名中均位居前列,具有较好的代表性。

  本文被引数据基于中国知网CNKI数据库,该数据库会实时公布最新单篇论文的被引情况。

  由于论文发表到被引之间会存在一定的滞后期,滞后期过短或者过长均不合适,因此根据影响因子计算原理,选取2年滞后。但中国知网的被引频次数据是实时的,难以精确查询某个时间段的被引情况,因此综合考虑后本文载文量的时间选取2015年,被引时间截止到2018年年底,所以从论文发表到被引大致滞后3年。

  《图书情报工作》2015年载文量为650篇,将会议通知、书评、简讯、专辑论文等删除,经整理后有效论文为483篇,变量的描述统计如表1所示。


表1 变量描述统计
变量名称 均值 极大值 极小值 标准差 Jarque-Bera 检验p值
被引频次 10.745 145.000 0.000 13.605 15343.701 0.000
作者数 2.346 8.000 1.000 1.161 163.486 0.000
n 483

  3 实证研究结果

  3.1 作者数与被引频次关系的统计分析

  被引频次的数据分布如图2所示。Jarque-Bera检验值为163.486,对应的p值为0.000,拒绝正态分布原假设,说明被引频次数不服从正态分布。其极大值为145次,仅有1篇论文;极小值为0次,即有20篇零被引论文。低被引论文占大多数,以15次被引以下的论文为主。



图2 被引频次的数据分布

  作者数的数据分布如图3所示。Jarque-Bera检验值为15343.701,对应的p值为0.000,拒绝正态分布原假设,说明作者数不服从正态分布。其极大值为8位,仅有1篇论文;极小值为1位,以1-3位的作者数的论文为主,作者数的均值为2.346。


图3 作者数的数据分布

  作者数与平均被引频次情况如表2所示。2位作者的论文最多,有175篇,平均被引频次为10.817;其次是1位作者的论文,有121篇,平均被引频次为9郾992;第三是3位作者论文,有117篇,平均被引频次为10.880。之后4——8位作者的论文数量依次减少,共有70篇。《图书情报工作》的论文合作率为74.95%,即两位作者以上的论文约占四分之三。

表2 作者数与被引频次
作者数 平均被引频次 论文数量   作者数 平均被引频次 论文数量
1 9.992 121 5 13.214 14
2 10.817 175 6 13.500 2
3 10.880 117 7 6.333 3
4 11.380 50 8 15.000 1

  单纯从平均被引频次看,可以发现随着作者数量的增加,除了7位作者外,总体上被引频次处于上升状态,但不能简单得出如此结论。本文区分单作者与多作者进行研究,因为1位作者可以认为科研合作很少或者几乎没有科研合作,2位及以上作者可以认为存在科研合作,因此有必要对单作者和多作者论文进行独立样本t检验,结果如表3所示。

表3 独立样本t检验结果
论文属性 样本数量 均值 t值 p值
单作者论文 121 9.992 -0.703 0.482
多作者论文 483 10.997

  独立样本t检验的t值为-0.703,对应的p值为0.482,说明单作者论文与多作者论文的平均被引频次没有显著差异。

  3.2 作者数与被引频次的回归分析

  将被引频次作为因变量,作者数作为自变量,采用双对数模型进行回归分析,之所以采用这种模型,目的是为了使回归系数具有弹性性质。由于少数论文是0被引,无法取对数,所以统计进行加1处理,这在计量技术上是通常采用的。结果如下:

  log(Y)=1.837+0.266log(X)
         (24.859***)(3.200***)R²=0.021
          n=483     (1)

  公式(1)中,Y表示被引频次,X表示作者数,回归结果显示,作者数与被引频次正相关,弹性系数为0.266,并且通过了统计检验,也就是说,作者数每增加1%,会导致论文被引频次增加0.266%。但模型的拟合优度R²极低,仅为0.021,也就是说,作者数量只解释了论文被引频次的2.1%。本质上也可以说,作者数对被引频次几乎没有影响。

  关于作者数对被引频次影响很低的问题,石燕青、孙建军[25]在研究论文国际合作时也发现了类似现象,模型拟合优度介于0.040—0.053之间,说明影响学者科研绩效的因素不仅仅是国际合作程度,未来仍需要深入分析,综合考虑各项影响因素,寻求更完善的模型来对学者科研绩效的提高进行分析。

  进一步引入作者数的2次项,回归结果如下:

  log(Y)=1.840+0.248log(X)+0.013log2(X)
          (22.297***)(1.072)(0.087)R²=0.021
           n=483      (2)

  作者数的1次项和2次项均没有通过统计检验,也就是说,作者数与被引频次之间不存在2次非线性关系。

  关于作者数对被引频次影响不大的原因是多方面的。Cronin[26]认为,一些领域欺骗性或名誉性的论文署名已经成为一种非常普遍的现象。一些论文在标注作者时可能比较随意,为了加强对作者合作的管理,一些期刊已经要求在论文中注明不同作者的贡献声明。有些作者之间合作可能比较紧密,而另外一些作者之间合作可能相对松散。一些学科可能需要作者进行密切合作才能进行研究,而另外一些学科,可能单个作者也能进行一些不错的研究。

  3.3 作者数与被引频次的分位数回归

  分位数回归是一种基于被解释变量的条件分布来拟合解释变量的特殊回归模型,本质是在均值回归上的拓展。它根据被解释变量取值高低将其分为不同的分位,研究解释变量对不同分位被解释变量的影响,可以从中总结解释变量弹性的变化规律。由于本文样本容量所限,选择过多的分位分析意义不大,因此选取5个分位进行回归,结果如表4所示。


表4 分位数回归结果
被解释变量 分位r 回归系数 t检验值 p值 拟R²
log(X) 0.200 0.631 5.487 0.000 0.043
0.400 0.415 3.487 0.001 0.021
0.500 0.290 2.705 0.007 0.010
0.600 0.250 2.709 0.007 0.008
0.800 0.167 1.649 0.100 0.004

  从回归结果看,分位r依次取0.200、0.400、0郾500、0.600,回归系数均在1%的情况下通过了统计检验,当分位子取0.800时,回归系数在10%的情况下通过了统计检验。随着分位数的提高,回归系数在逐渐降低,也就是说,对于低被频次的论文而言,提高作者数量可以更加有效地提高被引频次,图4可以清楚地看到这种现象。


图4 分位数回归结果

  与传统回归几乎一致的是,分位数回归的拟R²值依然很低,即作者数与被引频次的弹性虽然呈现出逐渐下降的趋势,但对被引频次的解释程度较低,所以这种规律也是不太显著的。

  4 结论与讨论

  本文基于中国知网以及《图书情报工作》的研究,发现单作者论文与多作者论文的平均被引频次没有显著差异;作者数虽然与被引频次正相关,但由于拟合优度太低,作者数对被引频次几乎没有影响;作者数与被引频次之间并不存在非线性关系;对于低被引频次的论文而言,作者数提高对被引频次贡献的弹性更大,但同样由于拟合优度太低,使得这种规律的体现并不显著。

  本文是综合采用独立样本t检验、传统回归、分位数回归得出的结论,虽然研究方法不同,但研究结论可以互相补充,并且大致一致,因此研究结果具有较好的稳健性。

  以往研究得出的关于作者数与被引频次的关系结论之所以矛盾,可能的原因与研究方法的应用存在瑕疵有关。科研合作无疑对于科学研究是有益的,也能提高科研产出,但这并不代表着就一定能够增加被引频次,单作者论文同样可以具有较高的被引频次。

  在学术期刊评价中,平均作者数经常被选为评价指标之一,这是值得商榷的。根据本文的研究结论,平均作者数不宜作为学术期刊影响力的评价指标。决定学术期刊影响力的根本因素,还是论文的质量与创新,与作者数量无关。

  当然,本文研究是基于单一期刊研究得出的结论,由于学科不同、期刊不同,研究结论也可能存在差异,作为一种研究范式,本文仍然具有一定的借鉴意义。

  参考文献

  [1] Gazni A,Didegah F. Investigating different types of research collaboration and citation impact:A case study of Harvard University's publications[J]. Scientometrics,2011,87(2):251-265.

  [2] Wagner C S. Six case studies of international collaboration in science[J]. Scientometrics,2005,62(1):3-26.

  [ 3 ] Bidault, F. , Hildebrand, T. The distribution of partnership returns:Evidence from co-authorships in economics journals[ J].Research Policy,2014,43(6):1002-1013.

  [4] 刘俊婉. 科学合作对高被引科学家论文产出力的影响分析[J]. 情报科学,2014,32(12):77-81.

  [5] Gl覿nzel W,Schubert A . Analyzing scientific networks through coauthorship[J]. Open Access Publications from Katholieke Universiteit Leuven,2004:257-276.

  [6] Leimu R,Koricheva J. What determines the citation frequency of ecological papers? [J]. Trends in Ecology &Evolution,2005,20(1):28-32. [7] Beaver D D. Reflections on scientific collaboration,(and its study):past,present, and future [ J]. Scientometrics,2001,52 (3 ):365-377.

  [8] Puuska H-M,Muhonen R,Leino Y. International and domestic copublishing and their citation impact in different disciplines[J].Scientometrics,2014,98(2) :823-839.

  [9] Kaur H ,Mahajan P. Collaboration in medical research:a case study of India[J]. Scientometrics,2015,105(1):683-690.

  [10] Abramo G,Angelo C A D,Solazzi M. The relationship between scientists' research performance and the degree of internationalization of their research[ J]. Scientometrics,2011,86 (3 ):629 -643.

  [11] 段宇锋,刘俊茹,步 坤. 期刊特征与被引频次的关系研究[J]. 情报资料工作,2018(2):13-18.

  [12] 陈淑娴. 期刊影响因子的影响因素分析[ J]. 山东理工大学学报(社会科学版),2006,22(4):110-112.

  [13] 肖学斌,柴艳菊. 论文的相关参数与被引频次的关系研究[ J].现代图书情报技术,2016(6):46-53.

  [14] 何 汶,刘 颖,杨红梅. 图书情报学高被引论文国际合著及贡献研究——基于文献计量学角度[ J]. 图书情报知识,2017(2):83-93.

  [15] Glanzel W. Seven Myths in Bibliometrics. About facts and fiction inquantitative science studies[ J]. ISSI Newsletter,2008,4 (2):24-32.

  [16] Bornmann L,Schier H,Marx W,et al. What factors determine citation counts of publications in chemistry besides their quality?[J]. Journal of Informetrics,2012,6(1):11-18.

  [17] Duque R B,Ynalvez M,Sooryamoorthy R, et al. Collaboration paradox:Scientific productivity,the Internet,and problems of research in developing areas [J]. Social Studies of Science,2005,35(5):755-785.

  [18] Glanzel W,Schubert A. Double effort = double impact? A critical view at international co-authorship in chemistry[J]. Scientometrics,2001,50(2):199 - 214.

  [19] Giovanni A,Ciriaco A D. The relationship between the number of authors of a publication,its citations and the impact factor of the publishing journal:Evidence from Italy[ J]. Journal of Informetrics,2015(9):746-761.

  [20] Avkiran N. K. Scientific collaboration in finance does not lead to better quality research [ J]. Scientometrics,1997,39 ( 2 ):173 -184.

  [21] 王 卫,潘京华,张晓梅. 合作能力指数及其实证研究[ J]. 情报杂志,2014,33(11):108-112,98.

  [22] 高自龙,范晓莉. 合作研究与人文社科论文质量的相关性探析——以人大《复印报刊资料》2010 年转载论文评估数据为例[J]. 中州学刊,2011(6):246-250.

  [23] 刘雪立,徐刚珍,方红玲,等. 如何提高医学期刊的影响因子——从《眼科新进展》 论文分类被引情况谈起[ J]. 中国科技期刊研究,2008,19(4):659-661.

  [24] 钟 镇. 农业经济与政策 Web of Science 期刊论文合著规模与绩效的相关性分析[ J]. 中国科技期刊研究,2014,25 (12):1513-1518.

  [25] 石燕青,孙建军. 我国图书情报领域学者科研绩效与国际合作程度的关系研究[J]. 情报科学,2017,35(11):114-120.

  [26] Cronin B. Scholarly communication and epistemic cultures[ J].New Review of Academic Librarianship,2003,9(1):1-24.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号