【摘 要】随着信息化的发展,期刊建立自己的网站已是大势所趋,且较多期刊已采取在网站中嵌入投审稿系统进行稿件的处理,在方便编辑部和作者的同时,也在一定程度上给稿件代投公司提供了投稿更省时、费用更低廉、可供选择的期刊种类更多的便利。这不仅增加了编辑部的工作量,给检索者带来损失,而且增大了学术不端的风险;因此,对目前我国学术期刊的网站建设现状进行调查很有必要。本文筛选出认可度较高的中国统计源核心期刊并调查了该遴选体系中期刊的网站建设现状以及它们在国内主流的百度、360搜索及搜狗搜索引擎中的排位情况,以了解目前我国学术期刊的网站建设现状及为作者识别官方网站提供参考。
【关键词】学术期刊;官方网站;排位
随着信息化的发展,期刊建立自己的官方网站(以下简称“官网”)已是大势所趋,较多学术期刊已建立了独立的官网,并且多数期刊还采取在官网中嵌入投审稿系统进行稿件的处理,实现了作者在线投稿、读者过刊浏览、期刊动态展示等功能,为作者、读者及编辑搭建了一个方便、快捷的沟通平台,减轻了编辑部的工作量,惠利了作者[1]。同时随着信息化、网络化的快速发展,读者、作者等(可以统称为“检索者”)往往是通过网络搜索平台查找目标刊物。然而目前国内的搜索引擎为了利益诉求,多采用竞价排名的方法显示搜索结果,但通常正规的学术期刊不参与这种竞价排名[2-3],其带来的后果是期刊公共信息不能得到公平呈现而最终误导检索者,给检索者造成经济或其他损失,增加学术不端的风险[4]。因此,本研究选取了期刊来源数据量大、认可度较高的中国统计源核心期刊,调查了其遴选体系内的期刊的官网建设现状,同时在百度、360搜索及搜狗搜索引擎中对此进行全面搜索,以了解这些官网在这些搜索引擎中的排位情况,以便为检索者准确识别官网提供参考。
1 官网的定义及其检索方法
1.1 官网的定义
在国内主流的万方数据库、中国知网和维普数据库(以下简称“3大数据库”)中,期刊官网呈现主要有3种形式:一是期刊独立的网站,二是期刊所在协会或学会的展示网站,三是期刊主管或主办单位的展示网站,这3类均被定义为官网。
1.2 官网网址的检索方式
确定官网网址可采用联合检索的方式进行[5-6]:1)在国内3大数据库中输入期刊名字进行检索,查看是否有网址信息,若有则提取网址进行验证;2)在数据库中检索2018年由期刊编辑部发布的最新稿约或最近发表的读者须知、投稿须知、征稿启事、征稿简则、说明等消息,若有网址信息则提取并进行输入验证;3)利用中国知网的“原版目录页浏览”功能,查看期刊的版权标志(有时在封三或封四),提取其中的网址信息;4)查询主管或主办单位官网。若单纯某一种方法无法确定网址,可综合这几种方法进行确定,若仍不能提取到网址信息或根据提供的网址信息确认时提示警示信息(如彩票网站、很明显就确定非期刊网站的其他网站)时被定义为无官网。本研究网址提取时若有主管或主办单位网址,只要基于这些网址发布了期刊信息,也同步进行提取(各层网址都进行了提取);但在域名分析时,只分析期刊直接对应网站网址的域名信息。
2 数据来源和搜索引擎的确定与检索方法
2.1 数据来源
通过检索并分析中国科技论文统计源期刊、《中文核心期刊要目总览》、中国科学引文数据库及中文社会科学引文索引这4种遴选数据库收录期刊的刊频分布、地区分布,最终选择中国科技论文统计源期刊进行分析。因其收录的期刊数最多、照顾了学科及地区平衡,同时由于本研究基于国内百度、搜狗搜索和360搜索(以下简称“3大搜索引擎”)进行检索,因此分析时剔除了刊名为英文名的期刊。然后从中信所官网上下载“2017年中国科技论文统计源期刊目录”(下载网址:http://www. istic. ac. cn/ )。下载日期为2018年10月30日,均系该时点最新版本收录清单。采用网络爬虫技术,在3大数据库和3大搜索引擎中爬取期刊的相关信息,包括刊频(月刊、双月刊、季刊等)、主管单位、主办单位、网址、详细地址等信息。
2.2 搜索引擎
根据艾媒咨询发布的“2018上半年中国移动搜索市场监测报告”[7],选择在我国市场份额占比前3位的3大搜索引擎。浏览器选择的是360浏览器(默认每页10条检索结果,但不含推广和广告),输入各搜索引擎的官网,直接在搜索栏中输入刊名全称,点击“搜索”,之后不进行任何操作。此外,根据网页浏览日志的用户行为研究发现,用户一般浏览8.05个页面[8],且一般浏览不会超过3页;因此,本研究仅研究前3页搜索结果的特征。采用网络爬虫技术,提取检索结果的特征,具体指标包括官网出现的位置、各检索结果的网址和说明信息。
3 中国科技论文统计源期刊官网建设的总体情况
从中国科技论文统计源期刊共下载2 454种期刊,其中106种期刊刊名为英文而未纳入分析,共计2348种期刊被纳入分析,其中自然科学卷1948种(有官网者1 857种),社会科学卷400种(有官网者314种)。对2171种有官网网址期刊的域名后缀进行分析发现,约有一半的期刊是申请的独立域名即一级域名,约1/4的期刊是依托于主办单位的二级域名,另有约1/4的期刊是依托于其他单位或公司的二级域名(简称“非自有的二级域名”),各类域名采用的后缀情况见表1。
表1 2171种有网址期刊的域名分布情况
注:IP地址网址没有域名,以IP地址直接访问。域名后缀 | 数量 | 比例/% |
一级域名 | 1011 | 46.6 |
ac.cn | 48 | 2.2 |
cn | 173 | 8.0 |
com | 371 | 17.1 |
Com.cn | 113 | 5.2 |
net | 70 | 3.2 |
net.cn | 32 | 1.5 |
org | 109 | 5.0 |
org.cn | 94 | 4.3 |
sh.cn | 1 | 0 |
主办单位二级域名 | 621 | 28.6 |
ac.cn | 47 | 2.2 |
cc | 2 | 0.1 |
cn | 52 | 2.4 |
com | 53 | 2.4 |
com.cn | 24 | 1.1 |
edu.cn | 393 | 18.1 |
gov.cn | 9 | 0.4 |
jl.cn | 1 | 0 |
jx.cn | 1 | 0 |
net | 11 | 0.5 |
net.cn | 1 | 0 |
org | 6 | 0.3 |
orb.cn | 22 | 1 |
非自有的二级域名 | 535 | 24.6 |
ac.cn | 4 | 0.2 |
cn | 49 | 2.3 |
com | 136 | 6.3 |
com.cn | 5 | 0.2 |
net | 258 | 11.9 |
net.cn | 70 | 3.2 |
org | 12 | 0.6 |
仅有IP地址 | 4 | 0.2 |
4 中国科技论文统计源期刊在国内“3大搜索引擎”中检索官网的排位情况
从总体期刊看,在3大搜索引擎平台中前3页有正确的官网显示者超过80%,百度最高,超过90%,搜狗和360搜索数据差别不大。正确官网出现的位置方面,官网出现在首页首位的比例均不高,都未超过50%,从高到低依次为百度、搜狗和360搜索。总体而言,自然科学卷各项指标的比例略高于社会科学卷。具体情况见表2-40。
表2 2171种有网站期刊网页在百度中搜索的排位统计情况
注:仅检索了前3页。类别 | 期刊总数 | 前3页有正确官网/种(%) | 首次出现在首页/种(%) | 首次出现在第2页/种(%) | 首次出现在第3页/种(%) | 百度合作期刊首位/种(%) | |
首位 | 非首位 | ||||||
所有期刊 | 2171 | 2016(92.9) | 994(45.8) | 1007(46.4) | 6(0.3) | 9(0.4) | 1716(79.0) |
自然科学卷 | 1857 | 1736(93.5) | 869(46.8) | 855(46.0) | 5(0.3) | 7(0.4) | 1501(80.8) |
社会科学卷 | 314 | 280(89.2) | 125(39.8) | 152(48.4) | 1(0.3) | 2(0.6) | 215(68.5) |
表3 2171种有网站期刊网页在搜狗搜索中的排位统计情况
注:仅检索了前3页。类别 | 期刊总数 | 前3页有正确官网/种(%) | 首次出现在首页/种(%) | 首次出现在第2页/种(%) | 首次出现在第3页/种(%) | |
首位 | 非首位 | |||||
所有期刊 | 2171 | 1748(80.5) | 753(34.7) | 889(40.9) | 79(3.6) | 27(1.2) |
自然科学卷 | 1857 | 1498(80.7) | 672(36.2) | 738(39.7) | 68(3.7) | 20(1.1) |
社会科学卷 | 314 | 250(79.6) | 81(25.8) | 151(48.1) | 11(3.5) | 7(2.2) |
表4 2171种有网站期刊网页在360搜索中的排位统计情况
注:仅检索了前3页。类别 | 期刊总数 | 前3页有正确官网/种(%) | 首次出现在首页/种(%) | 首次出现在第2页/种(%) | 首次出现在第3页/种(%) | |
首位 | 非首位 | |||||
所有期刊 | 2171 | 1804(83.1) | 216(9.9) | 1515(69.8) | 50(2.3) | 23(1.1) |
自然科学卷 | 1857 | 1547(83.3) | 189(10.2) | 1304(70.2) | 37(2.0) | 17(0.9) |
社会科学卷 | 314 | 257(81.8) | 27(8.6) | 211(67.2) | 13(4.1) | 6(1.9) |
5 结果分析与策略
5.1 期刊官网建设的必要性
在“互联网+”的时代背景下,建立独立网站是期刊品牌拓展的重要名片,可集采编系统(网络化稿件处理系统)、信息展示、文献开放获取(OA)等功能于一体,搭建了期刊和作者沟通的快捷通道;同时它也是期刊品牌化推广的重要工具[9],有利于突显刊物的品牌意义,有利于拓展期刊学术传播渠道,有利于提升期刊的服务能力[10]。
中国科技论文统计源期刊中的期刊官网建设,总体情况较佳,超过90%的期刊都建立了官网,较前几年文献[11-12]报道的比例明显提高。如:程维红等[11]2010年调查的1 868种中国科技核心期刊中的1105种有自建网站(59.2%);李若溪等[12]以CNKI收录的全部学术期刊8 169种为调查对象,进行抽样统计的结果显示,期刊自建网站的比例2011年为48.8%、2012年为59.5%,说明互联网建设发展速度很快。本次调查分析结果还显示,自然科学卷有官网期刊超过95%,社会科学卷有官网期刊的比例略低,未超过80%,值得关注的是,仍有7.5% (177/2 348)的期刊没有建立网站且其中绝大部分为社会科学卷所属期刊。另外还发现,建立了官网的期刊中,约一半申请的是独立一级域名,另约有一半申请的是基于主办单位或公司(主要是采编系统支持公司、数据库公司)的二级域名,仅有极少部分期刊未申请域名而采用IP地址访问的方式。若学术期刊的主办单位为科研院所、高等院校等时可以依托于主办单位申请单位的二级域名,这样反而更能有效突出科技学术期刊网站的归属,更方便作者鉴别[13-14]。
5.2 学术期刊官网的维护
期刊建立官网的目的,一方面是顺应“互联网+”时代背景下发展的需要,另一方面建立官网带来的便利不言而喻。尽管益处已被较多研究者证实,但是也存在诸多问题,如期刊官网相对于其他网站,功能相对单一,维护不足,给一些不法分子也提供了机会,如一些稿件代投公司趁机鱼目混珠,从而建立起相似的网站,让作者无法识别,给作者和正规期刊单位带来巨大的损失。基于此,在建立官网的同时,我们也要从以下方面采取措施进行维护与防范。
1)重视官网的认证。如加入百度认证之后就会有蓝色背景的“官网”字样,即可为检索者提供准确信息,以免使检索者进入钓鱼网站。目前主流的“3大搜索引擎”都具备官网认证功能。
2)由于目前期刊读者往往是通过CNKI、万方、维普等主要数据库检索文献且往往首先阅读的是部分文献[10],因而可在每篇文章的页眉、页脚、版权页或其他位置标注官方网址,以便于作者准确查找。
3)注重各数据库以及期刊主管和(或)主办单位中期刊信息的完整性及其正确性。目前科技人员主要通过国内“三大数据库”检索文献,因而在这些数据库中的期刊信息完整度及其准确性显得尤为重要。目前CNKI呈现的基本信息包括主办单位、出版周期、ISSN、CN、出版地、语种、开本、邮发代号和创刊时间;万方数据库呈现的期刊基本信息包括主管单位、主办单位、主编、ISSN、CN、地址、邮编、电话、E-mail和网址;维普数据库呈现的期刊基本信息包括主管单位、主办单位、总编/主编、ISSN、CN、地址、邮编、电话、E-mail、官方网站、邮发代号、单价及定价。CNKI并未显示期刊的网址信息,万方和维普数据库显示了部分期刊的网址信息。如前所述,期刊存在新建或变更官网网址的情况,应积极反馈并联系数据库进行添加或变更,同时数据库也应重视数据的定时更新。多方合力、共同维护,保证期刊官网正确显示,同时在期刊的主管单位和(或)主办单位网站上的信息也应及时更新和完善。
4)期刊应该主动定期查询“3大数据库”以及中信所网站,若新建或变更,均应及时联系处理,让权威数据库能够实时准确地展现期刊的信息,引导正确检索。同时,期刊的主管和(或)主办单位中呈现的网址信息也应重视,及时提交申请予以更新。
5)重视工信部备案。本研究团队在检索期刊网址的过程中发现,尽管万方、中信所提供的期刊网址一致,但以此期刊网址进行输入确认时,提示赌博网站、色情网站等,分析其原因可能是没有在工信部备案导致或者是更换了网址未予更新。不管如何,通过官方数据库查到的信息关联了不良的网站,对于期刊形象也会造成一定的不良影响[15-16]。
5.3 努力解决期刊在国内“3大搜索引擎”中检索官网的排位不理想情况
从本次分析结果看,前3页出现正确官网的比例最高为百度搜索,其次为360搜索和搜狗搜索,后二者间差别不大。虽然前3页大多有正确官网显示,但正确官网出现在首页首位的比例均偏低,都未超过50%,360搜索甚至低于10%。其原因可能是:学术类期刊面临的是特殊群体对象,总体人群量不大(相对普通网站而言),关注度较低有一定的关系;此外,搜索引擎采用竞价排名的方式,可以人为改变搜索结果,而学术期刊少有参与这种竞价排名致使公共信息不能得到公平呈现而最终误导检索者[17]。官网显示位置靠后带来的危害是,检索者面临大量的混杂信息,难以筛选正确信息,甚至可能被误导进入一些钓鱼网站。尝试解决的办法如下。
1)与搜索引擎平台合作,使期刊检索位置前置。目前只有百度开展了专门的期刊合作项目,学术科技期刊向百度平台提交期刊官网、ISSN、简介等基本信息,之后百度会进行审核认证,认证成功后将以特型方式优先展现在百度搜索结果中,并增加官网标识,这样可以帮助期刊树立权威形象,辅助作者快速识别期刊的官网,提升期刊品牌影响力及网站的关注度,不失为一种较好的方法。本次分析的结果表明,期刊在百度搜索中前3页出现正确官网的比例最高,可能跟平台开展了期刊合作有一定的关系。
2)监管部门也应高度重视,积极应对,帮助期刊维护合法权益,加强对搜索引擎平台的监督,促进期刊与搜索引擎平台合作,使期刊不参与竞价排名,为学术期刊提供统一的域名,加入反钓鱼网站联盟,提供钓鱼网站识别服务等。使主流搜索引擎切实履行社会责任,为我国的科技和社会发展助力且提供方便。
3)期刊网站本身数据的结构化程度和可被发现能力也需要大力建设及优化,如有效的关键词布局优化,杂志网站内链建设优化,提高文章质量、原创度、信息速度,要体现时效性和前沿性。
5.4 提升搜索引擎中的排名对期刊的价值和作用
搜索引擎对期刊编辑部的稿件处理过程的作用及意义不言而喻[18],期刊在搜索引擎中排名的意义更不可忽视。首先,在浩如烟海的互联网信息中,通过搜索引擎排名可以提升科技期刊在互联网上的可见度,提高期刊的影响力。其次,根据本研究的结果提示,一般用户浏览不会超过3页;因此,若期刊在搜索引擎中显示排名在前面,无论对新作者、老作者还是杂志发行商、广告商,均可以避免进入钓鱼网站、浪费搜索的时间,精准定位,快速找到相关且准确的信息。
总之,本研究选取了统计源核心期刊,采用网络爬虫及结合手工检索方式,调查了统计源核心期刊的官网建设情况以及在“3大搜索引擎”中检索官网的排位情况,结果表明官网建设速度快,但在,"3大搜索引擎”的排位还有待改善。另外,由于网络信息存在多变性,基于此结果,下一步还将挖掘数据价值,纳入全部的期刊进行分析,为我国的科技、社会发展提供更多的方便,助力科技快速健康发展。
6 参考文献
[1] 景勇, 郭雨梅, 丁岚.虚假科技期刊网站的防范与辨识[J].沈阳工程学院学报(社会科学版), 2016,12(4):455
[2] 孙昌朋, 林萍, 陈望忠.百度竞价排名对中文核心医学期刊官网在百度搜索中的影响及思考[J].中国科技期刊研究, 2016,27(8):888
[3] 杨继涛, 潘新社.科技期刊对网络侵权现象的防范措施[J].中国科技期刊研究, 2016,27(10):1076
[4] 罗云梅, 蒲素清, 李缨来, 等.华西期刊社1748篇疑似学术不端稿件的分析[J].编辑学报, 2018,30(3):278
[5] 马爱芳, 王宝英.中文科技期刊非法网站现状及其对策研究[J].中国科技期刊研究, 2016,27(4):401
[6] 湛江.学术期刊投稿方式的发布情况研究[J].新闻研究导刊, 2016,7(21):19
[7] 2018上半年中国移动搜索市场监测报告.(2018-07-27)[2019-09-01].http://www.iimedia.cn/61979.html
[8] 郭俊霞, 高城, 许南山.基于网页浏览日志的用户行为分析[J].计算机科学, 2014,41(3):110
[9] 杨德胜, 王昕.刍议医学学术期刊网站功能的优化[J].传播与版权, 2017(1):128
[10] 王明华, 沙勤, 顾凯, 等.学术期刊独立网站网络传播环境特征及其品牌拓展[J].编辑学报, 2015,27(2):112
[11] 程维红, 任胜利, 路文如, 等.中国科技核心期刊网站建设现状[J].中国科技期刊研究, 2011,22(5):649
[12] 李若溪,游中胜,田海江,等.我国学术期刊的网站建设现状调查与网络期刊进化趋势分析[J].中国科技期刊研究,2013,24(6):1049
[13] 张义, 陈怡平.科技期刊假冒网站应对措施[J].科技与出版, 2016(7):35
[14] 杨继涛, 潘新社.科技期刊对网络侵权现象的防范措施[J].中国科技期刊研究, 2016,27(10):1076
[15] 王艳军.有关我国假冒学术期刊网站侵权的研究进展及取得的初步成效[J].编辑学报, 2017,29(4):331
[16] 李四克.图书馆学核心期刊网络投稿研究[J].湖北科技学院学报, 2018,38(5):115
[17] 赵勋.论搜索引擎服务的准公共产品属性与竞价排名[J].理论导刊, 2011(2):61
[18] 易浩, 郭铁成, 熊芝兰.浅谈网络搜索引擎在期刊工作中的作用[J].科技与出版, 2004(6):49