【摘 要】[目的] 从差异性视角提出期刊区分度(Journal Discriminative Capacity,JDC)测算方法,并对期刊内容的差异性进行定量测算及分析,以探测不同期刊个体之间的区分性特征及不同学科期刊总体的差异化程度。[方法] 以2015—2017年SCI、SSCI、A&HCI收录期刊的题录信息为数据源,首先通过层次聚类和JDC测算对LIS学科23种期刊内容的差异性进行深入分析;然后通过计算不同学科的JDC并结合多维尺度降维分析法来探测学科间期刊的差异性特征,同时利用学科期刊个体的JDC均值来探讨不同学科期刊的差异性。[结果] LIS学科期刊的区分性出现明显分层,图书馆类期刊的区分性最强,评价与评述类期刊的区分性最弱;不同学科期刊具有鲜明的学科性特征,SCI收录期刊的区分性最为显著,SSCI收录期刊次之,A&HCI收录期刊的区分性最弱。[结论] 在单学科中区分度越低的期刊,其综合性特征越显著;而在多学科中,理工类期刊的内容差异性更为显著,其学科特色较人文社科类期刊更为突出。
【关键词】 期刊区分度;差异性测度;学科差异分析;可视化分析
学术期刊分析与评价一直是图书情报领域的重点研究方向,其对于指导学术期刊良性发展具有举足轻重的作用[1]。在当今知识爆发的时代,思想、技术、方法的推陈出新使得学术研究热点不断涌现,部分期刊为了追逐热潮逐渐丧失了自身的研究特色,呈现出“同质化”的发展趋向,期刊之间的差异逐步弱化,这非常不利于期刊的个性化发展和学术创新。因此,如何对期刊所刊载内容的差异进行度量和评价是非常有意义的研究课题。
当前针对期刊内容差异性的研究中,主要是利用聚类方法来对不同期刊群体的差异进行分析,很少有学者对不同期刊内容的差异程度进行定量测算,使得差异性研究存在不同程度的主观性和局部性,难以普遍应用于不同学术对象的差异性分析。为此,本文在现有研究的基础上,提出期刊区分度(Journal Discriminative Capacity,JDC)这一指标来衡量学术期刊研究内容的差异性及差异程度。该指标主要用于描述不同期刊个体在群体中的差异程度,区分度越大,表明期刊的差异性越显著,其研究内容更有独特性。利用该指标能够科学有效地对期刊差异性进行度量并检测出研究特色较强的期刊个体,为期刊的差异性分析提供了理论依据。
本文从内容差异性角度,利用JDC来对英文期刊研究内容的差异性进行定量分析。首先,以题录数据中的标题和摘要为基础数据,通过图书馆情报学(Library and Information Science,LIS,对应于WoS中的Information Science & Library Science)学科JDC的测算探究英文期刊的差异性特征,检测学术研究较为独特或“同质化”趋向较为明显的期刊个体,以探讨LIS学科英文期刊个体的差异化发展水平;然后,将其扩展到不同学科期刊的比较分析中,通过计算不同学科的JDC来探测不同期刊个体在多学科群体中的区分性特征以及不同学科总体的差异化水平,从而探讨不同期刊的学科性特征,为指导学术期刊的差异化、个性化发展提供参考。
1 近期相关研究
期刊的差异性研究旨在通过分析期刊刊载论文的内容来探测不同期刊的差异程度。当前对学术期刊差异性的研究大体上可以分为两类:第一类是采用影响因子、下载量[2]等外部数据,从质量[3,4]、影响力[5,6,7]、发展水平[8]、引证效率[9]等角度分析期刊之间的差异,这类研究主要探讨了学术期刊的外部特征差异,很少涉及期刊研究内容差异分析;第二类是利用题录数据(标题、关键词、摘要等)、引文等内部数据来对期刊刊载论文的内容进行分析,这些研究多是采用层次聚类[10,11]、多维尺度[12,13]、VOS[14,15]等方法来探测期刊在不同维度的聚集程度,以此来分析不同类别期刊内容的相似关系或差异性。第二类研究主要是根据期刊的聚集状况并结合定性分析来探讨期刊研究内容的差异性,但这种分析方法仅能探讨不同期刊群体的差异,而同一群体及不同群体的期刊个体差异则难以定量分析,同时,也极少有研究能够对期刊内容的差异性进行精确量化。此外,也有学者采用相似度来对期刊的研究内容进行定量分析以探测其差异性[16,17],但是相似度的方法仅能度量两两个体间的相似关系,无法探测群体中不同期刊个体的差异程度。
针对内容差异性的研究,也有学者对论文、主题、作者等其他学术对象进行分析。在学术论文层面,赵丹等[18,19,20]通过计量分析探讨了不同学术论文在研究热点、主题、质量等方面的差异;Boyack等[21]利用Jensen-Shannon Divergence[22]方法对文档对象在群体中的差异进行了分析。在研究主题层面,章岑等[23,24,25]采用层次聚类、多维尺度、共现网络、LDA主题挖掘等方法对不同研究主题的差异进行量化研究。在作者层面,魏瑞斌等[26,27,28,29]利用自引网络、相似度、多层聚类等方法探讨了不同作者在研究领域、主题等方面的差异。另外,也有部分学者对机构[30]、学科[31,32,33]等较大粒度学术对象的差异进行了探讨。总体来看,这些对论文、主题等学术对象的差异性研究多是利用聚类、多维尺度、共现网络、主题挖掘等方法来探究不同对象之间的内容差异,很少有学者对个体内容差异进行分析和度量。当然,也有少数学者对学术对象差异性的定量测算方法进行了探索。Salton等[34,35]提出的术语区分模型可以用于计算索引术语在信息检索中的差异,该方法虽然也存在一定的局限性,如算法复杂度较高,需要耗费大量的计算成本,仅能利用文档内容间接衡量术语差异等,但其核心思想对于期刊差异性的度量具有很好的借鉴作用。
综上所述,当前针对期刊以及其他学术对象差异性的研究主要存在以下几个问题:(1)现有期刊差异性的研究侧重于探究质量、影响力等外部特征,而利用期刊自身数据深入挖掘内容差异的研究相对较少;(2)针对期刊及其他学术对象的内容差异性研究主要是利用聚类、多维尺度以及各类网络模型来探讨不同对象群体的差异,而对于对象个体的差异则无法定量分析;(3)现有的术语区分模型所研究的对象粒度较小且算法复杂度较高,难以直接用于较大粒度学术对象和大规模数据的差异性定量计算。因此,本文在已有研究的基础上,借助术语区分模型的算法思想,提出一种基于JDC的度量方法,为探究学术期刊研究内容的差异性特征提供一种新的思路。
2 数据与方法
2.1 数据来源及处理
为探究英文期刊研究内容的差异性并进行学科间的比较,本研究分别从SCI、SSCI和A&HCI数据库中选取10个学科的英文期刊(表1)。将2015—2017年均被JCR归入Q1区和Q2区的期刊作为候选期刊;对于A&HCI期刊,则采用随机抽样方法选取候选期刊。通常认为,标题和摘要能够很大程度地揭示期刊论文的研究内容,可以很好地用于研究期刊内容的差异性。因此,本研究从Web of Science(WoS)数据库中获取2015—2017年各学科候选期刊的标题、摘要等题录信息作为数据源。
表1 学科列表
WoS学科名称 | 学科简称 | 中文名称 |
Optics | OP | 光学 |
Mathematics | MH | 数学 |
Materials Science, Multidisciplinary | MS | 材料科学 |
Engineering, Mechanical | EM | 工程及机械 |
Computer Science, Artificial Intelligence | CR | 计算科学及人工智能 |
Information Science & Library Science | LIS | 图书馆情报学 |
Business | BS | 商学 |
Sociology | SS | 社会学 |
History | HS | 历史学 |
Philosophy | PH | 哲学 |
针对数据的处理主要包括2个方面:(1)数据清洗及期刊筛选。将原始题录中摘要字段缺失的题录视为无效数据予以剔除;然后统计有效题录数据,将每年数据量低于30条的期刊剔除,从剩余期刊中按照影响因子排名选取研究对象。(2)数据抽样及文本处理。首先,采用分层随机抽样从每种期刊每年的有效题录数据中抽取30条作为实验样本;然后,采用题录信息分析软件SATI[36]提取标题和摘要,并进行分词、去停用词以及词根化,将所得的词根视为术语;最后,将其转化为<期刊编号,术语,术语权重>三元组以便后续使用。
2.2 JDC测算方法
JDC测算方法主要分为三个部分:期刊空间构建、空间密度计算和JDC度量,具体计算过程如下。
(1)期刊空间的构建。首先,将<期刊编号,术语,术语权重>三元组转化为期刊-术语矩阵(JTM,bJTM),其维度为m×n,其中m为期刊数量,n为第m种期刊所包含的术语数量,矩阵元素为术语权重值,其计算公式为
[Math Processing Error]aTF-IDF=aTF×aIDF=ftf,t×lg(m/mt+ε) (1)
式中:aTF表示文档频率;aIDF表示逆文档频率;ftf,t为术语t在期刊i中出现的频率;mt(mt≠ 0)为术语t在不同期刊中出现的频次;ε为调节因子,本研究中令ε=1/mt,以确保当m=mt时IDF不为零。然后,采用余弦相似度将JTM转化为期刊-期刊矩阵(JJM,bJJM),即期刊空间,可表示为
[Math Processing Error]bJJM=S1S2︙Sm=s11s12…s1ms21s22…s2m︙︙︙sm1sm2…smm (2)
式中:Si={sij | i,j∈m},表示期刊向量;sij为相似度值。
(2)期刊空间密度的计算。期刊空间密度(Journal Space Density,JSD)采用所有期刊向量Si与期刊空间中心(Centroid)的平均相似度进行计算,计算公式为
[Math Processing Error]DJSD=1m∑i=1mSDS(Si) (3)
式中:SDS表示Si与期刊空间中心的相似度。本研究采用基于距离的相似度[37],即
[Math Processing Error]SDS(Si)=c-Ddist(Si,Dcentroid),c=1.3 (4)
式中:Ddist(Si,Dcentroid)表示Si到期刊空间中心Dcentroid的余弦距离,其计算公式为
[Math Processing Error]Ddist(Si,Dcentroid)=∑i=1msij-1m∑j=1msij21/2 (5)
[Math Processing Error]Dcentroid=1m∑j=1ms1j,1m∑j=1ms2j,…,1m∑j=1msmj (6)
(3)JDC的度量。JDC是通过计算某一期刊被剔除后JSD的平均变化所得,其计算公式为
[Math Processing Error]DJDC,k=DJSD,k-DJSDDAVG_JSD (7)
式中:DJSD,k为期刊k被剔除后期刊空间密度;DAVG_JSD为该期刊空间的平均密度差,计算公式为
[Math Processing Error]DAVG_JSD=1m∑k=1m|DJSD,k-DJSD| (8)
3 实验与分析
3.1 LIS学科期刊JDC测算及分析
3.1.1数据预处理结果
通过对LIS学科候选期刊题录数据进行清洗,共筛选出23种期刊。提取2015—2017年题录中的标题和摘要作为实验数据。通过随机抽样和文本处理,共获得10936个术语和43607个三元组。数据预处理结果如表2所示。本节将以此为基础数据对LIS学科期刊个体的差异性进行深入分析和探讨。
表2 LIS学科期刊数据预处理结果
编号 | 期刊名称 | 期刊名称缩写 | 有效题录数量 | 样本量 | 术语总量 |
1 | College & Research Libraries | CRL | 141 | 90 | 1462 |
2 | European Journal of Information Systems | EJIS | 99 | 90 | 1922 |
3 | Government Information Quarterly | GIQ | 170 | 90 | 1848 |
4 | International Journal of Geographical Information Science | IJGIS | 344 | 90 | 2220 |
5 | International Journal of Information Management | IJIM | 273 | 90 | 1841 |
6 | Information & Management | IM | 233 | 90 | 1448 |
7 | Information Processing & Management | IPM | 211 | 90 | 1929 |
8 | Information Systems Research | ISR | 141 | 90 | 2105 |
9 | Information Technology & People | ITP | 116 | 90 | 2149 |
10 | Journal of Academic Librarianship | JAL | 207 | 90 | 1701 |
11 | Journal of the American Medical Informatics Association | JAMIA | 502 | 90 | 2254 |
12 | Journal of the Association for Information Science and Technology | JASIST | 610 | 90 | 1929 |
13 | Journal of Health Communication | JHC | 455 | 90 | 2062 |
14 | Journal of Knowledge Management | JKM | 222 | 90 | 1989 |
15 | Journal of Management Information Systems | JMIS | 127 | 90 | 1984 |
16 | Journal of Informetrics | JOI | 247 | 90 | 1676 |
17 | MIS Quarterly | MISQ | 153 | 90 | 2110 |
18 | Online Information Review | OIR | 177 | 90 | 2005 |
19 | Portal-Libraries and the Academy | PLA | 116 | 90 | 1429 |
20 | Telematics and Informatics | TI | 372 | 90 | 1964 |
21 | Research Evaluation | RE | 109 | 90 | 1848 |
22 | Social Science Computer Review | SSCR | 135 | 90 | 1895 |
23 | Scientometrics | STM | 1087 | 90 | 1837 |
总计 | 6247 | 2070 | 43607 |
3.1.2 期刊聚类分析
层次聚类可以根据内容特征将期刊聚为不同的簇,从而可以初步探讨不同期刊群体之间的差异。首先将三元组转化为JTM(维度为23×10936),采用层次聚类法对JTM进行聚类,结果如图1所示。

图1 LIS学科23种SSCI收录期刊的聚类结果
从图1可以看出,聚类结果整体层次清晰,23种期刊聚成了5个大类及3个单列类。①类主要为图书馆类期刊,②类主要为信息管理类期刊,③类主要为评价及评述类期刊,④类主要为信息系统类期刊,⑤类主要为医学信息类期刊。从结果来看该聚类结果是比较合理的,不同类别的期刊能被清楚地区分开来。从类别可以看出LIS学科英文期刊的研究领域较为广泛,不同类别期刊之间存在较为明显的差异。其中,IJGIS主要刊载地理信息方面的内容,与其他期刊的差异较大,所以被单列是比较合理的。而JKM和SSCR分别与③类和④类期刊靠近,说明这两种期刊与其他期刊具有差异,但差异可能不大。从组间距离来看,不同簇的组间距离也略有差异。组间距离越小,说明与其他期刊刊载内容的相似性就越小。由此可以看出,①、②类期刊与其他期刊具有较为明显的差异,而③、④、⑤类及单列类期刊之间的差异性可能并不十分显著。整体来看,该聚类结果较为合理,不同类别期刊之间表现出比较明显的差异,这表明对这些期刊进行差异性度量和分析是科学可行的。
3.1.3 JDC结果及分析
在聚类分析的基础上,对LIS期刊的JDC进行测算,并将结果绘制成散点图(图2)。同时,采用多维尺度降维分析法对JJM进行二维可视化(图3),并结合期刊的空间分布对期刊的差异性进行辅助分析。

图2 LIS学科期刊的JDC

图3 LIS学科期刊空间的二维可视化
(a)LIS期刊空间的整体分布;(b)方框区域局部放大
从图2可以看出:(1)LIS学科的大部分英文期刊的JDC值为正,说明这些期刊在群体中具有良好的区分性,大部分LIS期刊都保持了良好的研究特色;有7种期刊的JDC值为负,表明这部分期刊的研究内容可能具有“同质化”的特征。(2)JDC值域分布呈现出梯度化,多数JDC集中在(-1,1)区间内。JDC处在第一、第二梯队的期刊主要为图书馆类期刊(PLA、CRL、JAL)和信息管理类期刊(JOI、TI、IJIM、IPM),在图3所示的空间中,这两类期刊分布在外围(实线圈内),说明这两类期刊的学术研究独具特色,与其他期刊之间的差异显著,其中图书馆类期刊的研究特色最为鲜明。第三、第四梯队期刊的JDC整体上差距很小,集中分布在图3所示的方框区域,该区域放大后可以看到JDC为负值的期刊分布在虚线椭圆区域内,其他期刊紧密分布在其周围,说明这些期刊的研究内容特色不够突出,可能出现了不同程度的同化。(3)JDC为负值的期刊主要为信息系统类期刊和评价评述类期刊,说明这两类期刊的研究内容涉及范围较广,呈现出综合性特征,如MISQ、JASIST等期刊在LIS学科中具有重要地位,其研究内容多是LIS领域共同关注的问题,所以呈现出一定的综合性特征。而OIR等评述类期刊涉及的内容更为广泛,综合性特征尤为突出。JAMIA、JHC(医学信息类期刊)和IJGIS虽然在层次聚类中被单独列出,但其JDC都处于较低水平,没有表现出较大的差异性,说明这3种期刊的研究内容可能仍聚焦在LIS领域,医学、地理学方面的研究特征并不突出,可能存在“同质化”发展趋向。
3.2 学科间JDC的对比分析
3.2.1 数据预处理结果
通过对10个学科候选期刊数据进行清洗,按照影响因子排序从每个学科中获取前20种期刊作为研究对象,并从有效题录中提取标题和摘要作为基础实验数据。经过分层随机抽样共获得18000条样本数据,文本处理后共形成60928个术语和396362个三元组,如表3所示。在此基础上,对200种期刊的JDC进行计算,并对比分析不同学科期刊个体和总体的内容差异性特征。
表3 10个学科期刊数据预处理结果
学科 | 期刊数量 | 样本量 | 术语总量 |
BS | 20 | 1800 | 35637 |
CR | 20 | 1800 | 38922 |
EM | 20 | 1800 | 38282 |
HS | 20 | 1800 | 50764 |
LIS | 20 | 1800 | 37686 |
MH | 20 | 1800 | 30075 |
MS | 20 | 1800 | 46915 |
OP | 20 | 1800 | 40770 |
PH | 20 | 1800 | 36929 |
SS | 20 | 1800 | 40382 |
总计 | 200 | 18000 | 396362 |
3.2.2 学科间期刊个体差异性分析
为了更好地分析不同学科期刊个体的JDC特征,选取200种期刊中JDC排名前10和JDC排名后10的期刊进行分析。这20种期刊的JDC计算结果如表4所示。
表4 10个学科中JDC排名前10和后10的期刊情况
JDC前10名 | JDC后10名 | ||||
学科 | 期刊名称 | JDC | 学科 | 期刊名称 | JDC |
OP | Light:Science & Applications | 3.078 | BS | Supply Chain Management-An International Journal | -0.475 |
OP | Laser & Photonics Reviews | 3.054 | EM | Tribology Letters | -0.484 |
OP | Optica | 3.026 | EM | Drying Technology | -0.517 |
OP | Nanophotonics | 2.854 | EM | IEEE-ASME Transactions on Mechatronics | -0.537 |
OP | ACS Photonics | 2.773 | HS | International Journal of the History of Sport | -0.541 |
MS | ACS Nano | 2.635 | CR | International Journal of Neural Systems | -0.551 |
MH | Nonlinear Analysis-Theory Methods & Applications | 2.538 | BS | Journal of Intellectual Capital | -0.554 |
OP | IEEE Journal of Selected Topics in Quantum Electronics | 2.523 | LIS | Journal of the American Medical Informatics Association | -0.566 |
OP | Nature Photonics | 2.523 | SS | Agriculture and Human Values | -0.609 |
MS | NANO Letters | 2.502 | LIS | International Journal of Geographical Information Science | -0.841 |
从这20种期刊的JDC结果可以看到,JDC排名前10和后10的期刊在学科间具有明显的倾向性:排名前10的期刊均为理工类期刊,排名后10的期刊主要为人文社科类期刊。(1)排名前10的期刊中有7种期刊来自OP学科,且前5名均是OP期刊,说明在这10个学科中OP期刊的学术研究独具特色;其他3种期刊中有2种为MS期刊,其研究内容集中在纳米领域,另一种期刊为非线性分析领域的MH期刊,这3种期刊也表现出较大的区分度,表明它们的研究内容也具有鲜明的学科特色。(2)排在后10名的期刊学科较为分散,且它们JDC值均为负,说明其研究内容与其他学科出现了较多的交叉,具有一定的跨学科性。其中JDC最小的International Journal of Geographical Information Science(IJGIS)是典型的跨地理学和情报学期刊,表现出较强的交叉学科特性;有3种EM期刊的JDC也较小,说明这3种期刊可能与其他理工类期刊存在交叉领域。由此可以看出,不同学科期刊个体的JDC存在较大的差异,在整体上,理工类期刊的学术研究可能更具有独特性,而人文社科类期刊更容易出现跨学科特性。
3.2.3 不同学科JDC的数值分布
为了更加直观并全面地分析不同学科期刊个体的JDC特征,将10个学科期刊的JDC值绘制成散点图,如图4所示。

图4 10个学科的JDC数值分布
统计发现,10学科中有162种期刊的JDC值为正,其中有88种期刊的JDC值大于1,说明在期刊群体中大部分期刊都具有较为明显的差异性,并且10个学科期刊JDC的分布差距较大,理工类期刊和人文社科类期刊存在明显差异。(1)理工类期刊的JDC值普遍偏大,人文社科类期刊的JDC则相对较小,这表明理工类期刊具有鲜明的学科特色,其研究内容相比于人文社科类期刊更具独特性。(2)理工类期刊的学科差异非常明显。OP期刊的JDC值域范围最大,说明部分OP期刊具有不同程度的学科交叉,呈现出明显的跨学科性;MS期刊的JDC分布范围最小,整体处于较高水平,说明该学科期刊的研究领域相对集中,但其研究内容的独特性非常突出;EM期刊的JDC呈现出两极分化趋势且出现了较多负值,表明该学科期刊可能存在较多的交叉领域,期刊的跨学科性较为明显。(3)与理工类期刊相比,人文社科类期刊的JDC分布相对密集且处于较低水平,说明这些学科的研究范围相对比较狭窄,且学科之间的联系也较为紧密。其中BS期刊表现最为突出,部分期刊呈现出了较大的区分性,而PH期刊的JDC均处于较低水平,说明该学科期刊表现出了较强的综合性特征。(4)CR和LIS学科期刊的JDC值域范围都较大,说明这两个交叉学科期刊都表现出较大差异,但不同的是LIS学科中只有个别期刊的JDC比较突出,多数JDC仍处于较低水平,而CR学科的多数期刊都具有较大的区分度,这表明理工类交叉学科期刊的差异性大于人文社科类。因此,从不同学科JDC分布可以发现理工类期刊的内容差异性更为显著,其学科特色较人文社科类期刊更为突出。
不同学科期刊的研究内容可能具有一定的关联。因此,为了更加直观地探测学科间期刊的差异性特征,采用多维尺度降维分析法对JJM进行降维(图5),利用二维分布对学科间期刊的差异性进行可视化分析,从而探索学科间期刊的差异性和关联性。

图5 不同学科期刊差异的可视化
从图5可以看出,理工类期刊和人文社科类期刊被Y轴分成两个部分,这准确地反映了两者在研究内容方面的显著差异。(1)理工类期刊离散分布在第一、第四象限,且距离空间中心相对较远,所以理工科期刊具有较大的区分度,而人文社科类期刊集中分布在第三象限,不同学科期刊难以明显分离,表现出较强的关联性,所以期刊的整体区分度都处于较低水平。(2)CR期刊离散分布在Y轴附近,且与MH、EM、LIS学科期刊都呈现出一定的交叉关联,这充分反映了其交叉学科的特性;而LIS学科期刊离散分布在第二、第三象限,与BS、SS等学科期刊之间的关系也较为紧密,也表现出明显的交叉学科性质;OP和MS学科期刊孤立分布在空间外围,表现出了较强的独特性;EM学科期刊分布较为离散,其JDC表现出了明显的两极分化;而HS和PH学科期刊分布几乎混合在一起,说明这两个学科期刊刊载的学术研究关系密切,导致其期刊差异普遍较小。(3)JDC为负值的多数期刊密集分布在原点附近(虚线区域内),而JDC较大的10种期刊主要分布在空间的边缘(实线椭圆内)。由此说明:越靠近空间中心的期刊,其学科交叉特征就越明显,差异性就越小;而越靠近空间边缘的期刊,其研究内容的独特性就越显著,差异性就越大。当然,多维尺度降维会损失部分特征,导致JDC数值失真,如部分OP和MS期刊出现重叠,但对期刊的整体分布影响较小。
总体来看,理工类期刊和人文社科类期刊的差异性非常显著,理工类期刊的学术研究更为独特,人文社科类期刊的联系较为紧密,LIS和CR学科期刊的交叉研究特色鲜明,EM学科期刊差异性出现两极分化,JDC为负的期刊具有明显的跨学科性。
3.2.4 不同学科总体JDC分析
为了探究不同学科总体差异性特征,将每个学科20种期刊的JDC均值作为度量该学科总体差异性的指标,并利用标准差来衡量学科总体差异的离散程度,标准差越大,说明学科总体离散程度越大,该学科的研究范围就越宽泛,结果如图6所示。

图6 不同学科总体JDC直方图
从图6可以看到,各个学科的JDC均值存在着明显的差异,理工类期刊的总体差异性最大,交叉学科期刊的总体差异处于中等水平,人文社科类期刊的总体差异性最小。(1)MS和EM这两个工科学科期刊的JDC均值分别为最大和最小,而它们的标准差表现却相反,这种显著的差距说明MS学科期刊的研究领域较为集中,学术研究独特性较为突出,而EM学科期刊研究范围较广,表现出了交叉学科的特征。(2)OP和MH学科期刊的JDC均值都较大,但OP学科期刊的JDC均值离散程度最大,说明这两个学科总体差异都比较显著,而部分OP学科期刊具有跨学科性,使其整体呈现出了较大的离散度。(3)CR和LIS这两个交叉学科期刊的JDC均值处于中等水平且标准差相对较大,说明这两个学科的学术研究具有一定的独特性,但这种交叉学科离散程度较大的特征更为显著。同时,两个学科的JDC均值和标准差都相差不大,表明它们虽然属于不同的门类,但在内容的差异性和研究领域的广度方面均呈现出了相同的特征。(4)社会科学和人文科学期刊的JDC均值整体上都处于较低的水平,其中BS学科表现出较大的差异,突显了其学术研究的独特性,而HS和PH这两个人文学科期刊的总体差异程度较小,研究领域相对集中,这正反映了人文学科根源性和综合性的学科特征。
4 结论
本研究基于差异性视角对WoS数据库中不同学科英文期刊的差异性进行深入分析和探讨,分别从单学科和多学科的角度对LIS学科期刊和SCI、SSCI、A&HCI的10个学科期刊的区分性进行测度分析。(1)在LIS学科中,以PLA为代表的图书馆类期刊的研究内容具有鲜明的独特性,其区分度处于第一层次;以JOI为代表的信息管理类期刊次之,处于第二层次;而处在第三、第四层次的多为信息系统类和评述评价类期刊,这部分期刊呈现出了“同质化”的迹象,尤其是以OIR为代表的第四层次期刊具有明显的综合性特征。(2)在多学科期刊中,SCI收录期刊研究内容的区分度最大,SSCI收录期刊次之,A&HCI收录期刊研究内容的区分度最小;不同学科期刊的差异性具有鲜明的学科性,MS期刊的学科特色最为鲜明,总体区分度最大;OP和EM学科期刊的区分度出现两极分化,部分期刊具有明显的跨学科性;HS和PH学科期刊的研究领域较为集中,总体区分度也相对较小;而CR和LIS期刊的区分度处于中间层次,学科交叉性的特征非常明显。通过对英文期刊的差异性度量和学科间的对比分析,验证了JDC这一指标的广泛适用性,这对丰富和完善当前学术评价体系具有一定意义。
本研究虽然对LIS学科期刊个体以及不同学科期刊个体和总体的差异性进行定量计算和分析,但在研究过程中也发现一些问题,有待于进一步探究。在分析LIS学科以及学科间期刊差异性时仅选用了部分期刊作为研究对象,这可能会导致实验结果存在一定的片面性,后续将扩大样本在更大规模层次上探讨期刊的差异性。
参考文献
[1]Zhang F L .Evaluating journal impact based on weighted citations[J]. Scientometrics, 2017,113(2):1155-1169.
[2]Vaughan L, Tang J, Yang R B .Investigating disciplinary differences in the relationships between citations and downloads[J]. Scientometrics, 2017,111(3):1533-1545.
[3]徐芳, 刘文斌 .从知识积累角度评价SCI期刊学术质量[J]. 情报学报, 2013,32(10):1075-1089.
[4]Beets S D, Kelton A S, Lewis B R .An assessment of accounting journal quality based on departmental lists[J]. Scientometrics, 2015,102(1):315-332.
[5]刘雪立, 任胜利, 程维红 , 等.不同学科期刊CiteScore与影响因子的比较研究[J]. 中国科技期刊研究, 2017,28(9):837-841.
[6]刘芳, 朱沙 .学术期刊与学术成果影响力主要评价指标差异性研究——以Nature期刊为例[J]. 情报杂志, 2015(8):65-69.
[7]刘筱敏, 孙媛, 和婧 .Scopus与SCI来源期刊影响力差异化分析[J]. 中国科技期刊研究, 2014,25(9):1171-1177.
[8]Gazni A, Ghaseminik Z.Internationalization of scientific publishing over time: Analysing publishers and fields differences[J]. Learned Publishing, 2016,29(2):103-111.
[9]吴美琴, 李常洪, 宋雅文 , 等.基于窗口分析与松弛变量测度的期刊引证效率评价——18种图情期刊效率差异分析[J]. 情报理论与实践, 2017,40(2):122-127.
[10]Leydesdorff L, Bornmann L, Wagner C S .Generating clustered journal maps:An automated system for hierarchical classification[J]. Scientometrics, 2017,110(3):1601-1614.
[11]Tseng Y H, Tsay M Y .Journal clustering of library and information science for subfield delineation using the bibliometric analysis toolkit:CATAR[J]. Scientometrics, 2013,95(2):503-528.
[12]Wolfram D, Zhao Y H .A comparison of journal similarity across six disciplines using citing discipline analysis[J]. Journal of Informetrics, 2014,8(4):840-853.
[13]Wang F F, Wolfram D .Assessment of journal similarity based on citing discipline analysis[J]. Journal of the Association for Information Science and Technology, 2015,66(6):1189-1198.
[14]Gómez-Núñez A J, Vargas-Quesada B, Chinchilla-Rodríguez Z , et al.Visualization and analysis of SCImago Journal & Country Rank structure via journal clustering[J]. Aslib Journal of Information Management, 2016,68(5):607-627.
[15]Gómez-Núñez A J, Vargas-Quesada B, de Moya-Anegón F .Updating the SCImago journal and country rank classification:A new approach using Ward's clustering and alternative combination of citation measures[J]. Journal of the Association for Information Science and Technology, 2016,67(1):178-190.
[16]逯万辉 .基于深度学习的学术期刊选题同质化测度方法研究[J]. 情报资料工作, 2017(5):105-112.
[17]田大芳, 张瑞丽, 魏瑞斌 .基于关键词的期刊发文的相似性测度研究[J]. 现代情报, 2018,38(11):105-108,160.
[18]赵丹, 王晰巍, 李嘉兴 , 等.国内外大数据工具学术论文比较研究——基于文献计量方法[J]. 情报科学, 2016,34(6):133-137.
[19]张慧, 叶鹰 .1998—2017年《中国图书馆学报》论文的计量研究与品质分析[J]. 中国图书馆学报, 2018,44(5):34-46.
[20]王晰巍, 靖继鹏, 王韦玮 .中外信息生态学术论文比较研究——基于文献计量方法[J]. 图书情报工作, 2013,57(17):95-101.
[21]Boyack K W, Newman D, Duhon R J ,et al.Clustering more than two million biomedical publications:Comparing the accuracies of nine text-based similarity approaches[J]. PLoS ONE, 2011,6(3):e18029.
[22]Lin J .Divergence measures based on the Shannon entropy[J]. IEEE Transactions on Information Theory, 1991,37(1):145-151.
[23]章岑, 黄金霞 .国内外开放获取期刊研究内容对比分析[J]. 现代情报, 2016,36(9):159-167.
[24]马凤, 杨思洛 .国内外图书情报学研究的主题内容比较分析[J]. 情报科学, 2015,33(9):140-145.
[25]王连喜, 曹树金 .学科交叉视角下的网络舆情研究主题比较分析——以国内图书情报学和新闻传播学为例[J]. 情报学报, 2017,36(2):159-169.
[26]魏瑞斌 .基于自引网络和内容分析的学者研究主题挖掘[J]. 情报学报, 2015(6):635-645.
[27]步一, 王冰璐, 徐扬 , 等.科学合作中合作者研究领域差异研究[J]. 情报杂志, 2017,36(6):68-71,140.
[28]刘俊婉, 杨波, 王菲菲 , 等.基于LDA主题模型的学术谱系内知识传承研究——以谈家桢为核心的遗传学学术谱系为例[J]. 图书情报工作, 2018,62(10):76-84.
[29]Zhang L, Liu X H, Janssens F ,et al.Subject clustering analysis based on ISI category classification[J]. Journal of Informetrics, 2010,4(2):185-193.
[30]安璐, 余传明, 李纲 , 等.中美图情科研机构研究领域比较研究[J]. 中国图书馆学报, 2014,40(3):64-77.
[31]Zhang L, Janssens F, Liang L M ,et al.Journal cross-citation analysis for validation and improvement of journal-based subject classification in bibliometric research[J]. Scientometrics, 2010,82(3):687-706.
[32]Leydesdorff L .Visualization of the citation impact environments of scientific journals:An online mapping exercise[J]. Journal of the Association for Information Science and Technology, 2007,58(1):25-38.
[33]张琳 .期刊混合聚类的学科分类与交叉学科结构研究[J]. 图书情报工作, 2013,57(3):78-84.
[34]Salton G, Yang C .On the specification of term values in automatic indexing[J]. Journal of Documentation, 1973,29(4):351-372.
[35]Salton G, Yang C S, Yu C T .A theory of term importance in automatic text analysis[J]. Journal of the American Society for Information Science, 1975,26(1):33-44.
[36]刘启元, 叶鹰 .文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J]. 信息资源管理学报, 2012,2(1):50-58.
[37]Zhang J, Korfhage R R .A distance and angle similarity measure method[J]. Journal of the American Society for Information Science, 1999,50(9):772-778.