摘要:以CSSCI数据库中1998-2007 年度的引文数据为基础,计算出我国综合性社科类学术期刊的h指数、g 指数、不同时间跨度的影响因子。对期刊g 指数进行深入分析,发现g 指数能够一定程度上区分期刊的学术水平高低,但对于g 指数相同的期刊,则需要与其它期刊评价指标进行优势互补;对累积影响因子进行分析,发现综合性社科期刊比较活跃,变动较快;对h 指数、g 指数和累积影响因子进行对比发现,g 指数优化了h 指数评价指标,但不能取代h 指数指标,h 指数和g 指数在期刊评价方面一致性较强,累积影响因子与h 指数、g 指数在期刊评价方面存在相对较明显的差异性。通过相关性分析,发现综合性社科期刊h 指数、g 指数和累积影响因子的关系十分密切,相关系数也很大。
关键词:h 指数;g指数;影响因子;期刊评价
在科技日益发展、科技工作量急剧增加的今天,对期刊进行科学评价是十分必要的。h指数、g指数和累积影响因子都是用来评价期刊的科学指标,三者都是基于论文的数量和质量进行评价的指标,涉及的变量基本相似。h指数和g指数相较于传统的文献计量学指标具有许多优点,一经提出便成为学术界的研究热点,累积影响因子能够从较长时间跨度评价期刊的学术影响力。三者之间的关系如何,对期刊的评价结果是否一致,在期刊评价中能否互相代替是值得探讨的问题。本文利用CSSCI数据库1998-2007年的引文数据,选取CSSCI收录的47种综合性社科类期刊,计算出它们的h指数、g指数和累积影响因子,从而研究三种指标在期刊评价中的相关性。
1 相关概念
1.1 h指数
h指数是美国科学家Hirsch在2005年提出的旨在评价科学家学术成就的一项新指标【1】。该指标提出后引起了学术界的广泛关注,并获得热烈反响。Braun等人【2】则意识到h指数对期刊评价的意义,把针对作者的h 指数概念用于期刊提出了期刊h 指数。即如果一个期刊有h篇文章的篇被引次数不少于h,其余文章篇被引次数均少于h,则该期刊的h指数为h。Braun等人认为期刊h指数与期刊影响因子相比有较大优势,它对单篇高被引和低被引文章不敏感,数值比较稳定,并综合考虑了期刊数量(论文数量)和质量(被引频次)。
1.2 g指数
g指数是Egghe在2006年分析h指数评价效果时基于学者以往贡献提出的。即将论文按被引次数高低排序,并且将排序的序号平方,被引次数逐次累加,当序号平方等于累计被引次数时,该序号就被定义为g指数【3】。如果序号平方不能恰好等于而是小于对应的累计被引次数,则最接近累计被引次数的序号就是g指数。Egghe认为h指数的优点是对低被引频次文献不敏感,但是它应该对所有高被引频次文献敏感。g 指数很好地反映出了那些高被引文献,体现了高被引文献被引次数的增长对期刊学术影响力的影响。
1.3 累积影响因子
累积影响因子(长期影响因子)是E.Garfield在1995年鉴于传统的2年影响因子的局限性提出的。传统影响因子是反映该刊前两年所刊载论文在统计当年的平均被引用次数。作为一个相对值,影响因子仅能够反映前2年的论文在统计年被引用的情况。这一计量指标被考察期短,不能反映出期刊尤其是不同学科领域期刊之间被引频次分布规律的差异,对于那些发展缓慢学科领域内的期刊显然是不公平的【4】。累积影响因子是对影响因子概念的一个重大发展,它能够从较长的时间跨度来评价期刊的影响力,是对2年影响因子很好的补充和发展。在本文中,累积影响因子计算的时间跨度为5-7年,一方面接近Garfield在1998年《科学家》杂志提出的7年引用数,另一方面对《中国学术期刊综合引证报告》采用的5年影响因子的科学性进行评析。
2 数据来源及研究方法
CSSCI是我国第一个大型中文社会科学引文数据库,它的来源期刊选择较为严格,代表性较好,且兼有检索、查新和评价等多种职能【5】,南京大学的苏新宁教授及其带领的研究团队利用CSSCI数据库对各学科期刊的h指数进行了较为详细的评价与研究,彭爱东在文献6中针对综合性社科期刊的h指数做了深入分析【6】,本文直接从文献6获取47种综合性社科期刊的h指数数据。
另外利用47种综合性社科期刊的名称从CSSCI被引文献数据库检索这47种期刊的被引数据,获得被引文献统计年、被引作者、被引篇名等有用数据,转换为EXCEL格式;利用数据透视表,对文献被引次数进行汇总并按被引次数降序排列;然后按照g指数的定义计算出47种综合性社科期刊2000-2007各年的g指数。
累积影响因子的计算则是根据期刊名称从CSSCI来源文献数据库检索数据,获得1998-2006年综合性社科期刊刊载论文量,结合已有的被引文献数据,按照影响因子的定义计算出2005-2007三年的5-7年时间跨度的3种影响因子。
3 指标分析与对比
3.1 期刊h指数和g指数的对比

图1是47种综合性社科期刊2007年g指数的分布图。从图1可以看出,综合性社科期刊的g指数基本上在15以内,只有《中国社会科学》达到44,78.7%的期刊其g指数在3和8之间,19.2%的期刊g指数在9和15之间,说明期刊的g指数偏低,且分布并不均匀,期刊论文单篇被引频次普遍偏低,含有多篇高频被引论文的期刊数量并不多。

表1则列出了这47种期刊2000至2007年的g指数并按g指数降序排列。从表1可以看出,期刊g指数随着年代的增长而增加,其中《中国社会科学》成明显的跳跃式增长,其它期刊增长幅度较小,在相邻的年份里g指数不变或者增加1,少数增加2。g指数7以下的刊物通常需要经过两三年甚至更久的积累才能使其g指数增加1。《中国社会科学》g指数连续八年排名首位,并且与其它期刊拉开了较大的差距,表明该刊质量确实比较高,并且具有很高的学术影响力。《读书》、《国外社会科学》等一批期刊的g指数也保持了良好的发展趋势,影响力不断提高。
根据g指数的大小可以一定程度上区分期刊的学术水平高低,但对于处在同一水平区域(g指数相同)的期刊而言,则单纯从g指数无法比较其质量优劣,需要与其他期刊评价指标进行优势互补。表1进行对比分析【6】,发现期刊g指数高于h指数或与h指数相等,其中以《中国社会科学》表现最为明显,两指标的差值达11,其余期刊历年g指数与h指数的差值在0-5之间浮动,说明考虑了论文的高被引频次后g指数可以更好地彰显出质量较高的期刊。
标准差是一组数据平均值分散程度的一种度量指标,被用来评估数值的变化或波动程度。从表1可以看出,g指数排名越靠前的期刊,其标准差也越大,说明这些期刊g指数与平均值之间有较大差异,在近些年有较大的增长。标准差排名首位的《中国社会科学》的g指数从2000年的8上升的2007年的44,而标准差最小的《青海社会科学》其g指数只是从2上升到3。这也一定程度上体现出“马太效应”,高影响力的期刊论文能持续地获得更多的被引,从而其g指数也能得到较大提高;而原本影响力较低的期刊,则很难在被引次数上有大幅度提高,因此其g指数与高影响力期刊的g指数的差距越来越大【7】。
3.2 2 年影响因子与5 年、7 年累积影响因子的对比
影响因子作为传统文献计量指标中最重要的一种,反映的是期刊前两年所发论文在统计当年的平均被引率。两年时限计算得出的影响因子受很多因素影响,具有局限性和误用现象【8】。累积影响因子涵盖了更多期刊所发表文章被认可的信息,它比2年影响因子更能代表期刊较长时期内的平均水平,更符合人们对事物的印象是逐渐累积的现实【9】。

表2是47种综合性社科期刊在2005-2007年的3种影响因子。从表2可以看出,同种期刊在同一年份,5年影响因子值最大,6年影响因子值次之,最小的为7年影响因子值,说明综合性社科期刊比较活跃,更替速度较快。从期刊同种影响因子历年的变化来看,除了少数期刊,累积影响因子不断增长,说明综合性社科期刊的平均被引率逐渐上升,期刊质量不断提高。
从累积影响因子的排列顺序可以看出,除了《中国社会科学》一直名列首位外,其余期刊会由于选择的影响因子类型或年份不同而改变排列顺序,如2007 年的《开放时代》根据7 年影响因子排在第6位,而根据5年影响因子却位居第2位,说明对期刊进行评价应选择合适的影响因子。又如《文史哲》在2005-2007年的排列顺序明显不同,说明期刊每年收录的论文质量并不稳定,期刊优劣是一个相对指标,而并非绝对指标。另外,从具体数据看,《国外社会科学》2005年到2007年的累积影响因子不断降低,究其原因,该期刊在1999和2000年载文量分别为83和82篇,而在其它年份载文量均在100篇以上,最高达到192篇之多,说明载文量是期刊累积影响因子的一个重要影响因素。而《北京社会科学》累积影响因子也不断降低,究其原因,该期刊2002-2006的载文量和2000-2004的载文量相同为518篇,只是该刊2007年的被引频次为49,而2005年的被引频次为63,说明被引频次是累积影响因子的另一个重要影响因素。
3.3 h指数、g指数与5年、7年累积影响因子的对比分析
学术期刊的影响力评价研究备受期刊出版界和图书情报界的重视。影响因子作为一个经典的文献计量学指标,其对期刊影响力的评价功能已为国内外文献计量界所公认【4】,h指数和g指数提出后,受到广泛关注,成为新的研究热点。表3列出了2007年我国综合性社科类期刊中47中CSSCI来源期刊的h指数、g指数和累积影响因子的值及其排序。
h指数对被引频次很高的论文并不敏感,由h指数的定义可知,一旦一篇文章按被引次数排名在前h篇文章之中,那么它的被引频次即使再高也不会对h指数值产生任何影响。由表3可以看出,g指数弥补了h指数的这一缺陷,当h指数相同时,g指数的差异可以进一步区分期刊质量优劣,g指数反映出了高被引频次的文章,它在h指数的基础上优化了h指数评价指标。但对于h指数相同,g指数也相同的期刊则无法对其进行区分。
由于g 指数是由论文被引频次累加计算得来的,所以g指数与被引频次有极大的关系。当期刊单篇论文被引频次极高时,它的g指数可能明显偏高,而h指数却未必高,还有可能偏低。g指数相同时,只能说明期刊高频被引论文的被引总频次相同,而不能说明期刊高频被引论文数量多少,如《学术月刊》和《学术研究》的g指数均为11,说明这两种期刊的高频被引论文被引总次数累加至少为121次,而不能体现这两种期刊高频被引论文数量。由此可以看出,相较于h指数,g指数更好地反映了期刊质量指标(被引频次),却不能体现数量指标(论文数量)。而通过表3中的《学术月刊》h指数为9,《学术研究》h指数为8,可以发现《学术月刊》存在的高频被引论文数量多于《学术研究》。说明g指数和h指数各有优势,互为补充,而不能互相代替。

通过表3的排序数据可以看出,期刊h指数和g指数排序基本一致,5年影响因子和7年影响因子的排序拟合度较好,而h指数、g指数与累积影响因子的排序差异相对比较大。究其原因,首先,h指数和g指数只是考虑了高频被引论文,而忽略了低频被引论文,它们反映的是期刊高频被引论文的学术影响力,而累积影响因子考虑了期刊刊载的所有论文的被引频次,且期刊载文量是影响累积影响因子的一个重要因素,它反映的是期刊论文的平均影响力;其次,h指数和g指数体现的是一种累积学术影响力,论文被引年代为2000-2007年,来源文献不受时间限制,为2007年及以前的所有文章,而累积影响因子的被引年代仅为统计当年,虽然增加了时间跨度,其来源文献发表年代离统计当年也仅限于5-7年时间,相较于h指数、g指数,其时限仍然较短。
与文献【6】中的两年影响因子相比【6】,累积影响因子排序与h指数更趋向一致,说明h指数可以较好地衡量期刊较长时间内的学术影响力。当期刊h指数、g指数均相同时,可以使用累积影响因子对期刊进行进一步的评价。
由于h指数或g指数衡量的是高频被引论文的学术影响力,故单独使用h指数或g指数,不能体现期刊的总体质量,而累积影响因子衡量的是期刊论文的平均影响力,单独使用累积影响因子指标,则不能体现期刊的高频被引论文数量,故三种指标应该结合使用,优势互补。
4 各指标相关性分析
相关分析是一种基于假设检验的统计分析方法,而显著性水平(Significant level)反映了拒绝某一原假设时所犯错误的可能性【10】。利用SPSS统计软件对期刊的h指数、g指数和累积影响因子因素进行相关性分析,结果如表4所示。
在本检验中,显著性水平设为0.01,也即在原假设事实上正确的情况下,研究者接受这一假设的可能性为99%。本文的原假设是“相关系数为零”(即两个因素之间不存在显著的相关关系),经计算,统计量的相伴概率(即某特定取值及更极端可能值出现的准确概率,在表4中即Sig.(2-tailed))为0,低于0.01,因此可以认为“相关系数为零”的可能性很低。

由表4可以看出,期刊h指数和期刊g指数的相关性最大为0.989,期刊h指数、g指数与影响因子也存在显著的相关关系。g指数与影响因子的相关系数高于h指数与影响因子的相关系数,说明相较于h指数,g指数与影响因子的相关性更强。h指数与一般影响因子、5年影响因子的相关系数均为0.928,而与7年影响因子的相关系数为0.925,低于前者,5年影响因子与7年影响因子的相关系数为0.999、与2年影响因子的相关系数为0.995,说明5年影响因子一方面弥补了2年影响因子被考察期短的缺陷,另一方面可以代替更长时限的影响因子,同时也切合了综合性社科期刊较活跃、更替较快的特点。
5 结语
期刊h指数和g指数是一组崭新的评价指标,其意义表现在除丰富了期刊评价指标外,实际应用中对于评定学科领域权威期刊、改进核心期刊遴选指标体系也有一定参考价值【11】。本文利用CSSCI收录的1998-2007年度的引文数据,对综合性社科期刊的h指数、g指数进行分析,可以看出g指数能够一定程度上区分期刊的学术水平高低,但对于g指数相同的期刊,则需要与其它期刊评价指标进行优势互补;对累积影响因子进行分析,发现综合性社科期刊比较活跃,变动较快;对h指数、g指数和累积影响因子进行对比发现,g指数优化了h指数评价指标,但不能取代h指数指标,h指数和g指数在期刊评价方面一致性较强,累积影响因子与h指数、g指数在期刊评价方面存在相对较明显的差异性。通过相关性分析,可见综合性社科期刊h指数、g指数和累积影响因子的关系十分密切,相关系数也很大。5年影响因子弥补了2年影响因子被考察期短的缺陷,也可以代替更长时限的影响因子,并切合了综合性社科期刊较活跃、更替较快的特点,可见采用5年影响因子指标具有科学性。单独使用h指数或g指数指标不能体现期刊的总体质量,而单独使用累积影响因子指标不能反映期刊高频被引论文数量,因此,在进行期刊学术影响力评价时,应避免单项指标的局限性,注意指标之间的综合考量,可以起到相互验证,互为补充的作用,力求客观与公正。
参考文献
1 Hirsh,J.E.An index to quantify an individual’s scien⁃tific research output[J].Proceedings of the NationalAcademy of Sciences of the United States of America,2005,102(46):16569-16572.
2 Braun,T.,Glanzel,W.,Schubert,A.A Hirsch-type in⁃dex for journals[J].The Scientist,2005,19(22):8-10.
3 Egghe,L.Theory and practice of the g-index[J].Sciento⁃metrics,2006,69(1):131-152.
4 万锦堃,花平环,杜剑,宋慧敏.关注科学评价发展前沿实践文献计量指标创新——《中国学术期刊综合引证报告》采用的三种文献计量新指标[J].数字图书馆论坛,2007,(3):36-41.
5 邱均平,马瑞敏.基于CSSCI的图书馆、情报与档案管理一级学科文献计量评价研究[J].中国图书馆学报,2006,32(1):24-29.
6 彭爱东.我国综合性社科期刊的H指数分析——基于CSS⁃CI(2000—2007年度)数据[J].西南民族大学学报:人文社会科学版,2009,(10):83-89.
7 顾铖,祝晓明.我国管理学期刊的h指数分析——基于CSSCI(2000—2007年度)数据[J].西南民族大学学报:人文社会科学版,2009,(11):86-88.
8 于光,邹晓宇.六个学科三种期刊影响因子指标的比较研究[J].科学学研究,2008,26(A01):183-188.
9 周春雷,苏金燕,罗力.基于CSSCI的图情类期刊h指数评价研究[J].图书情报工作,2009,(8):139-141.
10 丁楠,潘有能.h指数和g指数评价实证研究——基于CSSCI的统计分析[J].图书与情报,2008,(2):79-82.
11 姜春林,刘则渊,梁永霞.H指数和G指数——期刊学术影响力评价的新指标[J].图书情报工作,2006,(12):63-65.