业内信息

基于科技期刊数据的学科出版信息挖掘与可视化研究

2018-11-23 来源:《科技与出版》
  【作 者】李雪、崔晓健、李晓光、蔡仁翰:国家海洋信息中心《海洋通报》《海洋信息》编辑部
 
  【摘 要】通过文献计量学研究对学科期刊数据资源进行挖掘、整合和分析,深入探索学科信息研究对期刊出版的科学价值,科技期刊出版者可以从学科科研热点、前沿趋势、地区优势、机构合作、作者遴选和专题策划等方面获取学科出版的潜在信息,为期刊出版实践提供重要的学术资源。本文以海洋学为例,选取“十二五”期间中外海洋学期刊数据资源进行出版信息挖掘和可视化分析,提供学科隐形情报和办刊参考,以期为科技期刊学术创新和出版能力提升提供一种重要的方法。
 
  【关键词】期刊数据挖掘;学科出版信息;信息反演;信息挖掘;可视化
 
  科技期刊是传播科学研究成果、交流学术研究、反映国家学术水平、体现国家文化软实力的重要载体。一方面,科技期刊在一定程度上代表了学科领域的发展水平;另一方面,通过稿件筛选机制,科技期刊引导性地传达办刊人在学术上的观点。通过文献计量学研究将学科期刊出版的文献资源进行数据挖掘和文本分析,利用可视化图谱形象地展现学科核心、发展历史及整体知识架构,这是图书情报学较常见的学科分析方法,但其在期刊出版领域的延伸研究还有待成熟,对科研行为动态网络关系分析不够深入。
 
  本文以图书情报学分析方法为基础,深入挖掘学科出版的潜在信息,量化数据反演成办刊所需的学科隐形情报和重要学术资源,如科研热点、专家资源、研究机构、国家和地区优势、国际合作等,有针对性地将学科信息转化为学科出版的实践,如专题策划、定向约稿、遴选科研机构与作者、鼓励科技创新、主题定位调整、国际前沿跟踪等,以可视化图谱勾勒出办刊需求指标的网络关系,为学科期刊出版提供决策指导,为现代化科学办刊提供信息挖掘分析的理念。
 
  1  学科出版信息挖掘方法
 
  以海洋学为例,笔者选取“十二五”期间中外海洋学期刊数据资源,通过文献计量学引文分析、共现分析,情报学学科相对优势、发展进程算法以及可视化软件的结合使用,将出版文献引证数据处理生成学科出版信息所需的数据产品和可视化图,提供重要的办刊指导。
 
  1.1  数据来源
 
  数据来源:中国学术期刊网络出版总库、Web of Science、国家自然科学基金委员会科学基金共享服务网(http://npd.nsfc.gov.cn/content.jsp)资助项目检索数据库和结题项目检索数据库。
 
  1.2  研究方法
 
  首先,以文献计量学方法对海洋学相关学术论文题名、关键词、词频、引用、下载、作者、机构、地区、出版年、基金资助等信息进行分析。然后,使用Navicat Premium和Microsoft Visual Foxpro工具对数据库资源进行提取、处理和规范,在海量数据中提取具有重要价值的资源进行分析、整合与挖掘,经模型建立与计算转换后(见本刊先前发表的文献[李雪。期刊大数据与学科发展测度研究:以海洋科学期刊研究为例[J].科技与出版,2017(1):98-103.]),对结果进行学科发展轨迹、相对优劣势、发展进程趋势的判断与预测分析,细化到海洋学各子学科的发展方向与舆情判断。在学科测度分析基础上,将数据研究结果与海洋专业实际相结合,利用CiteSpace和Tagxedo-Creator软件反演出版信息,指导学科期刊出版实践。
 
  2  信息挖掘在期刊出版中的应用
 
  科技期刊学术质量很大程度上取决于出版者对稿件的取舍与定夺,稿件出版和网络公开后的读者评议直接关系到期刊的声誉与学科领域地位。在现代科学办刊中,编辑需要打破思维的禁锢,拓宽对学科的认知,全面了解学科隐形情报,客观选择学术资源,挖掘具有特色的出版信息,因此,用科学数据支持期刊出版在办刊工作中将会越来越重要。
 
  2.1  弥补办刊常识缺漏,全面发现学科科研热点
 
  信息挖掘研究可为学科出版提供切实有价值的参考。科技期刊办刊人要明确科研热点,就要全面客观地掌握学科研究领域内的学术发展情况。出版信息挖掘研究利用了大数据技术词频跳变的特征和节点关系,通过可视化处理可帮助办刊人判断科研热点方向。一方面,编辑从数据挖掘研究生成的可视化图谱的年轮节点特征和共现关系结构中,可判断科研热点的学术关注程度,哪些热点处于当下学科研究的核心地位,哪些是从属地位以及它们之间的关系如何。据实例分析可知,这些科研热点关系有助于编辑对学科知识的全面把握。编辑自身的专业常识仅是办刊资源的一部分,更有意义之处在于此研究提供的知识弥补了编辑常识中的盲区。图1显示了海洋学热点方向及各热点方向间的相互关系与关联程度,编辑通常只了解这份图谱的一个片段,有些编辑是因为自身专业知识储备不足从而疏漏;还有些编辑是因为受制于被动接收自投稿思维的影响,难以将自投稿研究点转化为学科热点知识脉络,例如,气候变化、河口动力、富营养化、基因表达这些看似不搭界的研究内容实际上在海洋学科领域研究中具有千丝万缕的联系,编辑却不能充分运用这些重要科研热点,而学科热点可视化研究则为编辑提供较全面的有价值的学术资源选择。另一方面,对可视化图中科研热点年轮节点内外圈的最早关注和最近年份关注情况的分析,可帮助编辑获得学科知识点的演进情况,判断科研热点趋势。编辑可充分利用研究结果进一步跟踪该热点在专业领域内的科研发展动态,加强对科研热点学术黏性效应的运用,有计划跟踪分析热点发展状况,进行重点挖掘,策划选题,通过对学科科研热点的深入研究,及时选准学科报道方向进行出版策划,打造特色一流学科科技作品,占据学科期刊的报道阵地。
 

图1  专题资源关系挖掘可视化图例
 
  2.2  拓宽编者学术眼界,及时掌握学科创新前沿
 
  期刊出版对科技成果的宣传往往滞后于科学研究过程本身。常规的引文分析法可能无法给予及时的分析。通过学科信息挖掘可做出前沿创新预判与学科舆情分析。
 
  在前沿创新预判方面,利用词频变化分析国内外引文数据库,重点关注词频增长趋势,通过微妙的变化反演学科创新前沿,如“智慧海洋”最初出现在2015年初,随后词频分析显示“智慧海洋”出现量持续增长,2016年下半年出现拐点,彼时《海洋信息》办刊人发现这一现象,将其纳入前沿选题进行组稿,而今沿海各地纷纷开展该课题的重大工程项目,该刊率先拥有了这项前沿资源,充分说明学科隐形情报跟踪为学科出版提供了掌握竞争资源的可能性。
 
  在学科舆情分析方面,编辑可通过研究国家间学科领域合作关系和合作程度来获悉学科领域中各国的科研地位,从而探寻国际创新前沿。学科信息挖掘和可视化将学科领域内世界各国的文献资源量化形成相互间的学术连接关系网,在网络结构中可分析中国同世界各国在某学科的合作关系舆情,其中既有学科合作资源,也有在待开发领域中的学科隐性情报,特别是文献节点大年轮外圈的信息所提供的近年趋势中有合作优势的国家,编辑人员可重点关注与该国该行业领域的合作,追踪组织稿件,策划出版引导学科发展的内容。学科科研实力一般的国家也可以有该学科的国际型优秀期刊,专业领域的办刊人员要力争以数据为指导有所建树,办出世界一流的科技期刊,并以期刊作为推动学术交流的平台,关注和驱动国际学术合作,吸纳世界先进学科成果,搭建本土科技与国际前沿融合发展的合作方式,策划和促进合作成果及其稿件的生成。
 
  2.3  通晓学术资源分布,有效查找学科优势来源
 
  出版信息挖掘研究可帮助办刊人查找学术资源的优势分布情况,分为地区和机构两个维度。
 
  一方面,利用文献情报学学科相对优势计算模型和方法对学科出版数据进行分析,可计算出各地区(区域)学科发展舆情,帮助办刊人打破常规思维的禁锢,重新认识和发现学科在各地区的发展情况,掌握国内外行业领域学科优势信息,为期刊选题和地区稿件优选提供重要参考。研究发现,虽然我国海洋学研究水平在国际上优势不显著,但海洋工程子学科特别是侧重航道、船舶机械等研究方向具有很强的地区性优势,并且通过可视化分析可聚焦到我国台湾地区顶级论文产出率高居世界首位,超过欧美等发达国家,这为行业期刊出版提供了有利的情报信息,编辑可重点关注该地区该学科的发展,锁定范围查找成果产出来源,主动策划稿件进行特色出版。
 
  另一方面,挖掘学科领域机构信息也可为期刊出版带来重要的学术资源。优秀科研机构在国家创新系统中发挥着骨干引领的作用,通过科研机构优势分析可获取更多的一手行业情报,提供期刊选题策划的相关信息,尤其是可视化方式直接呈现科研机构与选题方向的相关度,可辅助办刊人提取出所需的科研机构列表及其科研水平排序情况,分析查找优质稿源。编辑可通过这些信息与科研机构进行沟通,具体了解情况并约请稿件。
 
  另外,编辑还可根据各机构间的科研亲疏关系重点追踪学科研究成果,将引导学科发展的研究成果吸纳到期刊上进行首发,如华盛顿大学、伍兹霍尔海洋研究所、法国海洋开发研究院等世界海洋学科领先机构的研究具有较强的相关性,可重点跟踪这些科研机构及与之合作密切的科研部门,追踪国际学科研究成果,策划特色选题。
 
  2.4  获悉行业领域人才,合理遴选学科专家学者
 
  对学科作者的研究可以通过作者间的文献引用关系,挖掘行业领域内的科研作者情况和学术流派情况,促进科技期刊出版对学科专业人才的信息获取。通过信息挖掘可认识到学科领域的领军人物、专家学者、核心作者、潜在作者以及学科作者间的学术合作关系,这是期刊出版搜寻稿源渠道的最直接的方法之一。学科作者数据分析可加强对稿件的自主开发力度,科学指导发现作者,有计划地组织专业定向约稿。通常,编辑在选题策划和约稿过程中会有两种难寻专家作者的情况,一种是编辑有选题但不了解有哪些专家作者在研究;另一种是编辑有预期的理想作者但被作者拒绝而找不到相关的备选作者。毕竟编辑人员的专家资源是有限的,能真正撰稿的知名专家也有限,出版信息挖掘研究通过学科作者之间的文献引用关系形成作者间的相互关系图谱以帮助编辑寻找更多优秀作者,拓宽选择作者的范围渠道,预期中的专家作者约稿未成,编辑尚可分析与其学术观点最密切的优秀同行并定题约稿。此外,数据挖掘还可提供交叉学科和相近、相似学科的人才情况,他们是本专业学科办刊人所不熟知的作者,却可为科技期刊创作出更多的学术作品,比如有关红海滩翅碱蓬的研究在海洋期刊编辑常识中是潮间带海洋生态学的范畴,而可视化研究发现有很多该领域的科研成果来自于植物学科研人员,这为编辑科学、有效地发现和遴选作者提供了更多可能性。不仅是遴选作者,在办刊中还可通过此研究方法吸纳更多的行业精英成为期刊审稿人、编委等,经常性地对刊物进行学术指导和规划建议。
 
  2.5  形成主动策划思维,科学辅助出版决策创新
 
  文献数据资源分析和文本挖掘可为期刊出版者提供专题策划、专栏策划、专刊以及新刊创办等重要学术参考。通过对科研专题的文献分析及相关性分析拓宽办刊人的选题思路,提供国内外学科领域进展的情报信息,以充实办刊学术资源,从而有效开发稿源,以专题打造特色科技期刊出版物,使期刊更具学术价值和学科领域前瞻性。在专题资源的挖掘中,办刊人不能仅限于挖掘国内学科的科研成果,虽然中国科技期刊的出版植根于中国科研体系,但不能将其发展凌驾于中国科研之上,国内一些科学研究并不是特别先进的学科领域,也可以作出该学科领域内具有国际一流水准的中国期刊,因此科技期刊编辑要从国内外出版资源中量化分析结果,打开主动办刊策划的思路。具体方法是,深度分析学科专题,寻找行业领域内及与其相关的学科、交叉学科和平行学科的专题关键词关系(图1)形成知识图谱,图例是针对“信息化”专题做出的文献资源挖掘可视化案例,可从中获取大数据、互联网+、云计算、物联网、人工智能、深度学习、人工神经网络等相关性很高的文献节点,将这些节点文本信息与海洋领域研究相结合,分析学科研究中这些关键词的有关情况,其结果确属目前国内该学科的前沿研究,这为期刊专题策划提供了大量的可开发的空间和资源。办刊人应善于运用专题分析开展稿件组织和专栏策划,以主动性的思维策划出版具有学科创新性的作品,满足学科读者的阅读要求。
 
  3  学科出版信息挖掘与可视化研究特点
 
  通过学科出版信息挖掘和可视化研究及其案例分析可知,信息深度挖掘加强了对传统文献计量学的延伸研究,进一步整合分析信息形成学科舆情,指导科学办刊,有以下4个特点:①对出版实践指导针对性强。科研热点、前沿合作、区域优势、科研机构、学科作者、专题资源等知识图谱信息都是办刊人可直观获取并能直接用于编辑出版的有效信息,在办刊中有实际用处。②可视化研究效果好。信息网络结构可清楚表达热点、前沿、机构、作者等各项挖掘点的网络结构关系,揭示哪些是核心地位、哪些是从属地位,它们之间亲疏关系如何等,图谱网络结构一目了然,便于办刊人进行选题策划。③分析结果较全面客观。常识和思维往往有局限性,学科信息挖掘分析可弥补办刊人学术资源常识的不足,为办刊人提供选题策划中会疏漏、遗忘甚至误解的学科信息,指导科学办刊。④研究的可待开发空间较大。学科信息挖掘是一项动态研究,文献计量学的发展完善还会为该研究提供更多的开发空间;另外,办刊人针对不同的学科属性可以开展个性化的课题挖掘分析。
 
  4  结语
 
  科技期刊出版已不再处于原先简单被动的收稿审稿时代了,高速发展的信息科技研究将出版推向了更加科学的层面。谁获取了真正有价值的学科情报,谁就拥有了选题策划的科学依据,也就登上了高于竞争者的瞭望塔。办刊人抢先掌握平时看似了解,但在意识里又模棱两可、不全面甚至存在偏见的出版信息,如学科方向、科研热点、区域优势、领先机构、领军人物等,主动将情报用于出版决策,将会在很大程度上助益办刊过程中各类问题的解决。科学在发展,期刊在发展,以科学支撑的期刊出版需要与时俱进,无论是优化办刊,还是定向特色出版,或是新刊创办,基于科技期刊数据的学科出版信息挖掘与可视化研究能够为我国科技期刊学术创新和出版能力提升提供重要学术支持。
 
 
 

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号