【摘 要】为了提高期刊竞争力、促进科学发展,本文通过中国知网检索得到《哈尔滨工程大学学报》2010—2019年2885篇正式学术论文的被引频次数据,并对其进行横向(逐年)、纵向(分区间)统计分析。本文对555篇零被引论文随发表时间变化规律做了研究,并对243篇高被引论文从学科、作者机构、基金项目三个方面进行分析。结果表明,论文被引频次按降序排列整体呈幂律分布;论文被引频次集中于1次、2次,高被引频次论文篇数相对较低;发表时间小于2年的论文中,零被引论文占比63.6%,说明这两年大部分论文处于休眠状态。高被引论文分析结果显示:41%的高被引论文属于船舶工程领域,86%的高被引论文作者来自"双一流"建设高校,60%的高被引论文是由国家自然科学基金析出。本文建议学报注重论文出版时效,积极开展针对性约稿工作,坚定信心走特色高校学报发展道路。
【关键词】被引频次;统计;高被引论文;零被引论文;“双一流”建设高校;国家自然科学基金
科学计量指标能够客观反映期刊论文质量和影响力,是期刊评价和科研管理工作的重要工具[1]。作为科学计量的重要指标之一,论文被引频次能够有效反映论文的学术水平、学术价值和学术影响力,相关研究结果对期刊评价、期刊发展规划、科研人员了解研究热点、学术论文撰写等都有重要意义。
论文被引频次一直是期刊人以及情报学者关注的重点,相关研究多集中于被引频次影响因素及其相互关系分析,大致分为单因素和多因素两类分析方法。第一是单因素影响分析。比如,研究从作者[2-4]、参考文献数量、质量[5-8]、引言表述特征词条[9]、学科差异[10]、下载频次[11]、发表时间[12]等单一因素对论文被引频次的影响进行分析。第二是多因素影响分析。比如,陈悦等[13]从影响论文被引频次的内在因素,如主题表征、合作规模和研究基础进行研究;牟象禹等[14]从作者声望、综合引用情况、作者学术能力、外文引用情况、引文被引频次、合作等因素对论文被引频次的影响进行了分析;鲍玉芳等[15]从被引频次影响因素和预测做了总结分析。
一些学者从不同领域期刊的角度开展论文被引频次研究。比如,一些学者对新闻传播界科技期刊[16]、生物学、物理力学、地质学期刊[17]、医药大学学报[18]、综合性高校学报[19]等期刊的论文被引频次做了研究。也有学者以单种期刊,如以《哈尔滨工业大学学报》[20]《编辑学报》[21-22]《北京工业大学学报》[23]《自然资源学报》[24]《质谱学报》[25]《东南大学学报(哲学社会科学版)》[26]《西南民族大学学报(人文社会科学版)》[27]等期刊为研究对象,对其高被引论文的特征进行分析。
本文对《哈尔滨工程大学学报》2010—2019年发表的论文被引频次进行统计分析,以期对学报评价和科学发展规划提供数据支撑。《哈尔滨工程大学学报》1980年创刊,是由工业和信息化部主管、哈尔滨工程大学主办的理工科综合性学术期刊。该刊依托哈尔滨工程大学“三海一核”(船舶工业、海军装备、海洋开发、核能应用)优势学科,秉承“集一流稿件创船海名刊”的办刊理念,在促进学术交流、发现和培养人才等方面发挥了重要作用。《哈尔滨工程大学学报》是中文核心期刊,同时进入美国Ei Compendex、荷兰Scopus、美国《剑桥科学文摘》(CSA)、中国科学引文数据库(CSCD)等重要数据库。
一、《哈尔滨工程大学学报》2010—2019年论文被引频次概况
截至2020年2月14日,中国知网数据库检索《哈尔滨工程大学学报》2010—2019年总计发文2987篇,剔除“哈尔滨工程大学简介”等非学术论文后,正式学术论文2885篇,其中有2330篇论文被引用,555篇论文未被引用,被引率为81%,总被引频次为16811次,篇均被引7.2次,接近我国论文篇均被引次数8.55次(2006—2016年统计结果)[28]。论文被引频次最大值为139次,最小值为1次(不计零被引论文)。笔者将2010—2019年论文被引频次按降序排列,得到排序结果,如图1;进一步统计相同被引频次的论文篇数,得到各年被引频次与对应论文篇数结果,如图2。

图1 2010—2019年论文被引频次降序排序结果

图2 2010—2019年各年被引频次与论文篇数统计结果
由图1、图2我们可以得出以下结论:第一,学报论文被引频次整体呈幂律分布,这一结果与毛国敏等[29]的研究结论相同;第二,论文被引频次集中于1次、2次,高被引频次论文篇数普遍较低;第三,2010—2013年发表的论文被引频次明显高于其他年份,说明论文发表时间对被引频次有一定影响。
2010—2019年零被引论文约占总发文的19%,各年零被引论文篇数分布如图3所示。由图3我们可以得到以下结论:随着论文发表时间缩短,零被引论文整体呈上升趋势,2010年零被引论文有14篇,仅占当年总发文的5%;而2018年、2019年零被引论文达到117篇、236篇,分别占当年总发文的38%和76%,二者合计占所有零被引论文的63.6%。这是由于论文发表时间较短,大部分论文并未被读者关注,或者即使已被引用,但由于论文发表时滞因素,读者无法检索到相应引用结果,造成2018年、2019年大部分论文暂时处于休眠状态,一旦渡过休眠期,笔者相信这两年的零被引论文篇数将大幅下降。

图3 2010—2019年各年零被引论文篇数分布
二、2010—2019年论文被引频次统计分析
(一)被引频次逐年统计分析
本文采用SPSS软件对2330篇论文被引频次进行统计分析,给出了被引频次平均值、标准差、众数、总被引频次等统计结果,具体如表1。我们可以得出以下结论。
表1 2010—2019年各年论文被引频次统计结果
论文数 | 2010年 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 | 2017年 | 2018年 | 2019年 |
268 | 277 | 254 | 248 | 236 | 278 | 250 | 255 | 191 | 73 | |
平均值 | 11.2 | 10.4 | 11.4 | 7.8 | 7.5 | 5.6 | 5.1 | 3.5 | 2.7 | 1.4 |
总被引频次 | 2997 | 2869 | 2894 | 1938 | 1780 | 1544 | 1272 | 894 | 520 | 103 |
众数 | 2 | 2 | 3 | 1 | 5 | 1 | 1 | 1 | 1 | 1 |
标准差 | 11.99 | 9.55 | 15.55 | 6.71 | 8.07 | 5.07 | 4.87 | 2.94 | 2.33 | 0.70 |
最大值 | 107 | 58 | 139 | 37 | 71 | 50 | 37 | 24 | 14 | 4 |
最小值 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
第一,随着论文发表时间增长,被引频次平均值逐渐上升,论文发表时间最短的2019年被引频次平均值仅为1.4,而2010年被引频次平均值达到11.2,是2019年的8倍。
第二,随着论文发表时间增长,论文总被引频次亦逐渐上升,与被引频次平均值变化规律相似,2019年总被引频次为103,而2010年是2997,是2019年的29倍。
第三,被引频次众数是被引频次中出现次数最多的数值。随着论文发表时间增长,被引频次众数并未呈明显的线性变化,但发表时间小于5年的论文,被引频次众数在0—1之间分布,而发表时间大于5年的论文,众数分布在1—5。
第四,被引频次标准差反映了被引频次相对于平均值的离散程度,即每篇论文的被引频次与被引频次平均值之间的差距。随着论文发表时间增长,被引频次标准差(除2012年外)大体呈现上升趋势,与被引频次平均值变化规律相似。2019年被引频次标准差为0.70,而2010年被引频次标准差达到11.99,是2019年的17倍。该统计结果符合实际情况,即论文发表时间越长,学术价值高的论文被引次数越来越多,而其他论文被引频次则处于较低水平,造成被引频次差异化明显,因而标准差较大;而近几年论文的发表时间短,被引频次普遍较低,甚至零被引论文占比超过1/3,被引频次差异不明显,标准差较小。本文结果中,2012年被引频次标准差为近十年的最大值15.55。这是因为2012年发表的两篇论文被引频次分别达到103次、139次,为近十年的极值,因此,2012年被引频次标准差也为最大值。
第五,随着论文发表时间增长,论文被引频次最大值(除2012年、2014年外)大体呈现上升的趋势,由2019年的4上升至2010年的107,后者是前者的27倍。
综合以上统计结果我们可以得出以下结论:发表时间对论文被引频次影响较大,以5年为分割点,发表时间小于5年的论文,被引频次受发表时间影响较大;而论文发表时间大于5年,其对被引频次的影响权重降低,而论文或期刊本身的特征,如论文研究方向、学术价值、作者声望、期刊影响力等[30]因素对被引频次的影响加强。
(二)被引频次区间分析
本文基于被引频次降序排列结果,以10%、20%、50%排序百分位数(对应的被引频次分别为16、11、5)为分割点,将被引频次分为4个区间,1区:被引频次在[16,∞)为高被引区间;2区:被引频次在[11,15]为次高被引区间;3区:被引频次在[5,10]为中被引区间;4区:被引频次在[1,4]为低被引区间。4个区间论文篇数分布结果如表2。
表2 2010—2019年论文被引频次4个区间论文篇数统计结果
区间 | 被引频次 | 2010年 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 | 2017年 | 2018年 | 2019年 | 合计 | 占总被引论文比例 |
1区 | ≥16 | 60 | 62 | 47 | 32 | 21 | 12 | 7 | 2 | 0 | 0 | 243 | 10% |
2区 | 11-15 | 41 | 37 | 33 | 29 | 34 | 20 | 17 | 5 | 3 | 0 | 219 | 10% |
3区 | 5-10 | 81 | 93 | 90 | 90 | 86 | 96 | 78 | 57 | 27 | 0 | 698 | 30% |
4区 | 1-4 | 86 | 85 | 84 | 97 | 95 | 150 | 148 | 191 | 161 | 73 | 1170 | 50% |
合计 | 268 | 277 | 254 | 248 | 236 | 278 | 250 | 255 | 191 | 73 | 2330 | 100% |
第一,1区:共有论文243篇,占总被引论文的10%。本文定义被引频次排序在前10%的论文为高被引论文。2010—2014年有222篇,占高被引论文的91%,即发表时间为5年以上的论文被引充分,整体被引频次较高。在该区间,有3篇论文的被引频次分别达到103次、107次、139次(发表于2012年、2010年、2012年),被引频次突破100次。这可以被认为学报论文被引频次的极值,说明这3篇论文学术价值高,可借鉴意义很大。
第二,2区:共有论文219篇,占总被引论文的10%。该区间内,2010—2014年的论文篇数为174篇,而2015—2019年的论文数为45篇,前者是后者的近4倍。
第三,3区:共有论文698篇,占总被引论文的30%。该区间论文所占比例较高。除2017—2019年论文篇数较少(分别为57篇、27篇、0篇)外,其他年份论文篇数相对平均,共614篇,占3区论文的88%。
第四,4区:共有论文1170篇,占总被引论文的50%。一半的论文被引频次在4次以下,其中2015—2019年有723篇,占4区的62%。这说明发表时间在近5年的论文被引频次相对偏低。
我们由以上结果可以看出,在1区、2区间,发表时间大于5年的论文占比较高;而在3区、4区则相反,发表时间在近5年的论文占比较高。因此,我们可以以论文发表时间5年为分割点,对论文被引频次进行统计研究。
三、高被引论文分析
2010—2019年,《哈尔滨工程大学学报》高被引论文共有243篇。本节从论文学科、作者机构、基金项目三个方面对高被引论文进行分析。
(一)论文学科
高被引论文学科分布如图4。由图4可见,船舶工程、机械工程、信息通信、计算机方向的高被引论文较多,其中,船舶工程领域的论文占比最高,达到41%。该结果与《哈尔滨工程大学学报》鲜明的船舶与海洋学科特色密不可分,其依托哈尔滨工程大学“三海一核”优势学科,探索出了一条点面兼顾的特色高校学报发展之路,多年来得到了船舶与海洋领域的学者认可,对学报的发展形成了积极的正反馈。该结果也为《哈尔滨工程大学学报》作为船舶与海洋领域特色高校学报提供了有力佐证。学报应坚定特色高校学报发展道路。

图4 2010—2019年高被引论文学科分布
(二)作者机构
高被引论文的数量可以反映研究机构的高水平科研成果产出能力。本文将作者机构划分为5类,分别是一流大学建设高校、一流学科建设高校(前两类即“双一流”建设高校)、普通高校、科研院所和其他。高被引论文作者机构分布如图5。从图5中我们可以得出以下结论:学报的高被引论文有89篇(占比37%)来自一流大学建设高校,120篇(占比49%)来自一流学科建设高校,二者共占高被引论文的86%;而普通高校、科研院所分别占9%和3%。可见,“双一流”建设高校产出论文数量多、质量高,更易被读者关注并引用。

图5 2010—2019年高被引论文作者机构分布
在高被引论文中,209篇论文的作者来自24所“双一流”建设高校,高校名单具体如表3。这些高校名单不乏我国理工科名校,如清华大学、上海交通大学、吉林大学和浙江大学等,但北京大学、中国科学技术大学等高校作者向《哈尔滨工程大学学报》投稿很少。本文建议学报在稳定当前作者队伍的基础上,积极拓宽约稿范围,力争实现理工科“双一流”建设高校全覆盖,促进期刊学术影响力的进一步提升。
表3 2010—2019年高被引论文作者机构中的“双一流”建设高校名单
一流大学建设高校(14所) | 论文篇数 | 一流学科建设高校(10所) | 论文篇数 |
哈尔滨工业大学 | 25 | 哈尔滨工程大学 | 95 |
大连理工大学 | 21 | 大连海事大学 | 7 |
上海交通大学 | 9 | 东北林业大学 | 5 |
清华大学 | 7 | 南京航空航天大学 | 2 |
吉林大学 | 6 | 武汉理工大学 | 2 |
浙江大学 | 4 | 西安电子科技大学 | 2 |
天津大学 | 4 | 北京交通大学 | 2 |
同济大学 | 4 | 长安大学 | 2 |
西北工业大学 | 3 | 东华大学 | 2 |
中国海洋大学 | 2 | 安徽大学 | 1 |
北京航空航天大学 | 1 | ||
北京理工大学 | 1 | ||
武汉大学 | 1 | ||
厦门大学 | 1 |
(三)基金项目
基金项目析出高被引论文结果如表4。由表4可见,国家级基金项目析出论文共175篇,其中国家自然科学基金项目为146篇,占所有高被引论文的60%,具有绝对优势;部级基金项目析出论文为31篇,省(自治区、直辖市)级基金项目析出论文为36篇,其中黑龙江省级项目为22篇,占该类项目的61%,反映了学报论文的地缘性特征。
国家自然科学基金对科研人员的软硬件要求都很高,更易产出高水平学术论文。有研究表明,国家自然科学基金析出论文被引频次明显高于其他基金论文和无基金论文[31]。因此,本文建议进一步加强国家自然科学基金项目的约稿工作,提升学报总被引频次。
表4 2010—2019年基金项目析出高被引论文结果
金类别 | 篇数 | 百分比 | |
国家级基金项目 | 国家自然科学基金 | 146 | 60% |
其他 | 29 | 12% | |
部级 | 31 | 13% | |
省(自治区、直辖市) | 黑龙江省 | 22 | 9% |
其他省(自治区、直辖市) | 14 | 6% | |
其他 | 1 | 0% |
四、结论
本文对《哈尔滨工程大学学报》2010—2019年发表论文被引频次以及零被引、高被引论文进行了统计分析,得出以下结论。
第一,论文被引频次按降序排列,整体呈幂律分布;论文被引频次集中于1次、2次,高被引频次论文篇数普遍较低。2010—2013年发表的论文被引频次明显高于其他年份。这说明论文发表时间对被引频次有一定影响。
第二,以论文发表时间5年为分割点,发表时间小于5年的论文,被引频次较低,受发表时间影响较大;而发表时间大于5年的论文,被引频次相对偏高,发表时间对被引频次影响的权重降低。
第三,随着论文发表时间增长,被引频次众数并未呈现明显的线性变化,但发表时间小于5年的论文,被引频次众数在0—1之间分布,而发表时间大于5年的论文,众数分布在1—5。
第四,随着论文发表时间增长,被引频次标准差(除2012年外)大体呈上升趋势,与被引频次平均值变化规律相似,2019年被引频次标准差为0.70,而2010年被引频次标准差达到11.99,是2019年的17倍。
第五,零被引论文中,发表时间小于2年的论文占比为63.6%,大部分论文处于休眠状态。
第六,高被引论文结果显示,41%的高被引论文属于船舶工程领域;86%的高被引论文作者来自“双一流”建设高校;60%的高被引论文是由国家自然科学基金析出。
基于以上研究结果,笔者对学报的发展提出以下建议。首先,学报要注重论文出版时效,充分利用中国知网、新媒体等传播速度快、范围广的网络平台,力争论文录用到网络首发零时差,消除纸质期刊出版时滞问题;其次,学报要积极开展针对性约稿工作,针对“双一流”建设高校中承担国家自然科学基金项目的学者进行约稿,提升学报的影响力;最后,学报要坚定信心,依托优势学科,走特色高校学报发展道路。
参考文献
[1]马峥.通过计量指标分析发现操纵期刊评价结果的行为[J].编辑学报,2016(06):608-611.
[2]王黎明,张啸岳,俞立平.论文作者数与被引频次关系的再思考[J].情报杂志,2019(09):166-170+157.
[3]Jazayeri H E,Carr B R,Lee K C,et al.Trainee Contribution Is Not Associated With Citation Frequency:A Retrospective Study[J].Journal of Oral and Maxillo-facial Surgery,2019(07):1377-1380.
[4]Yan E J,Chen Z,Li K.Authors'status and the perceived quality of their work:Measuring citation sentiment change in nobel articles[J].Journal of the Association for Information Science and Technology,2020(03):314-324.
[5]Virgo J A.A Statistical Procedure for Evaluating the Importance of Scientif ic Papers[J].The Library Quarterly:Information,Community,Policy,1977(04):415-430.
[6]Webster G D,Jonason P K,Schember T O.Hot Topics and Popular Papers in Evolutionary Psychology: Analyses of Title Words and Citation Counts in Evolution and Human Behavior,1979—2008[J].Evolutionary Psychology,2009(03):15-23.
[7]Stanek K Z.How long should an astronomical paper be to increase its Impact?[J].Ads Abstract Service,2008(09):1-11.
[8]康旭东,徐庆富,张春博.期刊单元下参考文献与论文被引频次间的关系—以WebofScience凝聚态物理学科为例[J].中国科技期刊研究,2018(06):619-626.
[9]高丹,李秀霞,周娜.基于改进CARS模型的学术文献被引频次影响因素分析[J].数字图书馆论坛,2018(10):18-24.
[10]张艳玲.学科定位差异与高校人文社科综合期刊被引频次[J].陕西师范大学学报(哲学社会科学版),2018(05):172-176.
[11]丁佐奇.基于WebofScience的论文使用次数和被引频次的相关性分析[J].中国科技期刊研究,2017(12):1166-1170.
[12]俞立平,王艳.学术期刊被引频次的时间分布规律研究—以图书馆、情报、文献学期刊为例[J].情报科学,2016(05):159-162.
[13]陈悦,宋超,周京生,等.文献计量学视角下的论文被引频次影响因素研究—兼评使用与被引之间关系[J].情报杂志,2019(04):96-104.
[14]牟象禹,龚凯乐,谢娟,等.论文被引频次的影响因素研究—以国内图书情报领域为例[J].图书情报知识,2018(04):43-52.
[15]鲍玉芳,马建霞.科学论文被引频次预测的现状分析与研究[J].情报杂志,2015(05):66-71.
[16]张立,杨文涛,尤瑜,等.新闻传播类期刊论文被引频次影响因素的模糊评判与验证—基于16本CSSCI源刊的实证分析[J].出版发行研究,2018(05):65-69.
[17]段宇锋,刘俊茹,步坤.期刊特征与被引频次的关系研究[J].情报资料工作,2018(02):13-18.
[18]郎朗,孙昌朋,林萍,等.我国5种医药大学学报在国内外数据库中高被引论文的对比分析[J].中国科技期刊研究,2019(01):77-82.
[19]张崭颖.综合性高校学报零被引论文分析——以CSSCI来源期刊为例[J].出版广角,2017(23):50-52.
[20]赵丽莹,苗秀芝,张红,等.《哈尔滨工业大学学报》2006—2015年高被引论文分析[J].图书情报工作,2016(S2):160-165.
[21]马峥,俞征鹿.《编辑学报》2002—2018年主要计量指标分析[J].编辑学报,2019(06):701-705.
[22]张建合.《编辑学报》高被引论文分析[J].编辑学报,2010(06):562-564.
[23]吕小红.分析高被引论文明确选题组稿方向——以《北京工业大学学报》为例[J].中国科技期刊研究,2014(02):303-307.
[24]何春娥,王群英,冯亚文.《自然资源学报》1986—2015年零被引论文分析[J].自然资源学报,2018(09):1666-1674.
[25]沈莹,骆淑莉,王迎真.《质谱学报》高被引论文分析对选题组稿的启示[J].编辑学报,2018(S1):146-148.
[26]余敏.《东南大学学报(哲学社会科学版)》被引论文特征分析及启示[J].东南大学学报(哲学社会科学版),2016(06):142-145.
[27]吴俊.高被引论文的特征分析——以西南民族大学学报(人文社会科学版)为例[J].西南民族大学学报(人文社会科学版),2017(12):229-233.
[28]张立,杨文涛,尤瑜,等.新闻传播类期刊论文被引频次影响因素的模糊评判与验证——基于16本CSSCI源刊的实证分析[J].出版发行研究,2018(05):65-69.
[29]毛国敏,蒋知瑞,任蕾,等.期刊论文被引频次的幂律分布研究[J].中国科技期刊研究,2014(02):293-298,307.
[30]孔玲,王效岳,于纯良,等.学术论文离被引有多远——基于影响因素与预测方法的文献述评[J].情报资料工作,2019(06):63-72.
[31]张诗乐,盖双双,刘雪立.国家自然科学基金资助的效果——基于论文产出的文献计量学评价[J].科学学研究,2015(04):507-515.