业内信息

数据挖掘与智能筛选视角下的科技期刊选题策划

2020-03-16 来源:《出版科学》
  【作 者】蒋学东、涂鹏、阳丽霞:中南大学《铁道科学与工程学报》编辑部

  【摘 要】针对科技期刊传统选题策划面临的数据有限、信息精准度不高及以编辑经验为主的问题,探 究大数据和人工智能背景下的选题策划优化方法。通过分析大数据和人工智能背景下科技期刊选题策划 面临的挑战,结合大数据和人工智能为选题策划优化在数据、算力和算法三个层面提供的理论、方法和 技术,探究科技期刊选题策划各关键环节的优化方法。以期运用大数据的智能自动化人机协作功能,科 学配置大数据资源,使科技期刊的选题策划决策建立在大数据科学描述、预测和诊断的基础之上,达到 科技期刊选题策划的科学化、自动化和精准化。

  【关键词】大数据;人工智能;科技期刊;选题策划优化

  科技论文的质量是科技期刊强大生命力的保 证,选题策划是科技期刊吸引高质量科技论文、 扩大自身影响力的前提。选题策划作为科技期刊 出版流程的源头,其创新程度直接决定后续所有 流程的效果。科技期刊选题的精准程度不仅影响 科技期刊自身的创新发展和品牌质量,更在一定 程度上影响整个行业乃至国家科技界的创新速度 与进程。随着信息技术的高速发展和数据信息交互、共享与开放程度的持续加快,大数据已成为 数据化时代与货币、黄金等同等重要的新经济资 产。在科研领域,大数据正引领第四科学范式—— 数据密集型科学(Data-Intensive Science)的到 来,并逐步推动传统科学的假设驱动模式向基于 大数据探索的数据密集型方法转变 [1]。在世界各 国均已逐步将大数据和人工智能作为国家基础性 战略资源的背景下,我国相继出台了《促进大数 据发展行动纲要》和《新一代人工智能发展规划》, 大数据和人工智能被正式列入国家级战略层面, 成为我国未来提升国际竞争力的主要手段 [2]。作 为科学技术信息传播主力军的科技期刊,在大数 据和人工智能双驱动不断加速的今天,更应尽快 在科技信息传播的各个环节高效应用大数据和人 工智能,不断优化资源配置,加强人机协作,凸 显大数据基础上描述、预测、诊断和决策的智能 自动化,以大数据和人工智能技术带来的科学化、 自动化和精准化推进科技期刊选题策划的高质量 发展,为我国第一生产力的创新、迭代和引领增 加强劲动力。

  1 科技期刊选题策划现状

  科技期刊的选题策划是编辑人员依据一定的 方针和主客观条件,开发科技研究出版资源、设 计选题的创造性活动,是编辑工作与出版工作之 “本”。选题策划决策的优劣直接影响科技期刊 的质量和行业影响力,在科技期刊所有工作中有 着举足轻重的地位。大数据时代科技期刊需求侧 的在线化、数字化、多元化、碎片化的需求日益 加速,在一定程度上反向倒逼了作为供给侧的科 技期刊在前向供应链上的在线化、数字化和多元 化调整。

  现有传播环境下的科技期刊选题策划,数据 化和智能自动化程度不高,经验为主的传统选题 策划模式依旧占有较大比重。传统的选题策划方 式常以编辑征求专家或期刊编委意见、参加学术 会议、关注基金项目、统计作者和读者问卷调查 结果、向一线研究人员了解行业发展动态等为主。 这些选题策划方式往往因速度较慢、获取数据有 限、信息精准度不高、编辑劳动重复繁琐等原因 导致选题策划在时效性、前沿性、延续性、集聚 效应、精准度匹配等方面无法实现预期目标,其 大成本投入与生产服务效率严重不匹配,最终对 科技期刊信息传播的内容、过程、效果和传播主 体的积极性、创造性等各方面都造成了严重影响。

  2 大数据和人工智能背景下,科技期刊传统选题 策划方式面临的挑战

  2.1 传统选题策划面临如何发现交叉学科和新兴 领域的挑战

  随着互联网的普及、科学技术创新加速和交 叉学科的不断涌现以及新兴领域的兴起,传统的 期刊编辑因语言不通、专业隔阂等使得其对研究 领域前沿问题和热点问题的把握容易出现偏差, 难以继续凭有限的个人经验实现选题策划科学决 策。与此同时,约稿对象和审稿专家的精准定位 与沟通方式也已发生了巨大变化。“内容为王”是 科技期刊发展的永恒主题,如何利用大数据和人 工智能的技术和已有研究成果揭开交叉学科和新 兴领域等内容“皇帝”的隐形新装,打破专业领 域的隔阂、突破时空的界限,通过将领域专家知 识地图、研究机构成果地图、领域术语关联地图 等有效结合并运用于科技期刊选题策划,抓住交 叉学科和新兴领域这颗王冠上的明珠,实现决策 计划与执行人的精准统一便成为数据时代科技期 刊选题策划急需解决的一个重要问题。

  2.2 传统选题策划面临策划内容与受众需求适应 性的挑战

  科技期刊的选题策划须在现有领域研究现状 基础上围绕受众需求最大限度地发挥创造力和能 动性。在互联网迅速发展的今天,受众需求呈现 出明显的个体差异且快速变化的特点。科技期刊 的受众既有读者,也有作者,而受众对于科技期 刊选题策划的认可度对期刊的品牌建设和质量提 升有着决定性作用。作为信息供给侧源头的科技 期刊选题策划如果不能及时响应受众需求,实现 与受众高强度的关联互动,为受众及时提供增值、 创新和深层次的个性化体验,则可能面临信息传 播无效乃至被受众背弃的严重后果。近年来我国 部分领域研究成果外流、科技期刊冲击世界一流 期刊屡屡受挫、部分期刊甚至出现稿源不足等情 况都在一定程度上说明了选题策划面临的这一问 题。在人人都是传播者的今天,选题策划“受众 中心”的执行力度和效度对科技期刊的信息传播力影响尤为明显,优秀的选题策划能使科技期刊 发展进入良性循环并逐步跨入强者恒强的加速轨 道,不好的选题策划则可能让弱者卷入恶性循环 最终走向不复存在的深渊。因此,大数据时代的 科技期刊需格外重视基于“受众思维”的选题策划, 从源头上杜绝恶性循环。

  2.3 传统选题策划面临数据挖掘清洗及人工智能 筛选的挑战

  全媒体时代数据的关联性增强、不确定性增 大、数据载体多样化和数据增量指数化等对于期 刊编辑凭个人原有的经验和有限的知识来策划选 题构成了前所未有的挑战。不借助数据清洗挖掘 技术和人工智能技术,编辑部有限的人力无法应 对数据的极速增长,科学降噪和归类利用大数据 更无可能。如何充分挖掘大数据这一宝藏并利用 人工智能完成多源数据的自主流动、合理配置, 实现选题策划的科学性、前沿性、时效性和创造 性是大数据智能时代科技期刊信息传播亟需解决 的急迫问题 [3]。

  3 大数据和人工智能背景下科技期刊选题策划的 优化目标

  大数据和人工智能背景下的科技期刊选题策 划工作,要在时效性、科学性、前沿性、可操作 性和集聚效应等方面树立品牌抢占先机,就必须 在数据、算力和算法等方面充分利用人工智能技 术挖掘相关数据价值 [4],解决大数据的不良影响 因素,逐步提升算力、优化算法,努力实现决策 阶段的高度自动化与智能化。

  随着大数据和人工智能的迅猛发展,其 理 论、方法和技术为科技期刊选题策划提供了三个 层面的优化目标。第一层面为数据层面的优化目 标,即针对全媒体传播开发数据收集渠道和伪数 据甄别系统,利用大数据技术和人工智能技术实 现科技期刊选题策划相关研究领域科学真实的数 据资源泛化收集。第二层面为算力层面的优化目 标,即对第一层面收集来的数据资源进行精确分 析。随着大数据和人工智能的蓬勃发展,针对大 数据体量庞大且日增量巨大,不确定性高,关联 度和可信度低等影响因素,研究者们提出了模糊 集、粗糙集和三支决策理论等方法,为科技期刊 选题策划有效进行大数据的精确分析提供了强有 力的技术和理论支撑。第三层面的优化目标为数 据分析结果的可视化展现,即算法层面的优化目 标。这一层面应围绕选题策划优化模型的构建, 在研究前沿探测、专家知识地图绘制、研究成果 可视化呈现及新兴领域识别遴选等方面下足工夫, 充分挖掘大数据价值,通过智能自动与人机协作 结合,努力实现选题策划的高度自动化、智能化 和精准化。大数据和人工智能在数据、算力和算 法层面赋能科技期刊选题策划优化的关键环节, 能使已有研究成果大数据资源和受众情况得到泛 化收集和精确分析,并在此基础上通过及时发现交叉学科、精准探测研究前沿,预测科技期刊发 展方向,绘制研究成果地图,优化专家知识地图 构建,最终推动选题策划的高质量发展。基于已 有的大数据和人工智能技术,优化科技期刊选题 策划关键环节的简要框图如图 1 所示。



图 1 基于大数据和人工智能技术的科技期刊选题策划优化框图

  4 基于大数据和人工智能技术的科技期刊选题策 划优化方法

  基于大数据和人工智能技术的科技期刊选题 策划,从数据收集、分析、预测、诊断到决策,都 建立在大数据基础之上,以数据、算力和算法为 支点,以智能自动化 + 人机协同为主要工作模式, 围绕选题策划优化目标,以数据科学、人工智能 引领优化互相关联的各要素,准确探测研究前沿、 识别新兴领域、构建专家知识地图、可视化呈现 已有研究成果和受众数据分析结果。基于大数据 和人工智能技术的选题策划优化模型如图 2 所示。



图 2 基于大数据和人工智能技术的选题策划优化基本模型

  4.1 选题策划之研究前沿探测优化

  科技期刊选题策划中,泛化收集多源大数据 并运用云计算、边缘计算和其他相关算法,以更 全面关注研究机构成果、探测专业和交叉领域研 究前沿、识别其演变路径非常关键。以某专业领 域最新文献簇作为前沿探测基础,通过分析高频 词、共现聚类的关键词和数据流等在特定学科热 点和前沿主题研究中的应用,采用专家咨询法评 估研究结果的相关性,可初步探测特定学科的研 究热点和前沿主题 [5]。通过追踪、收集、分析高 产研究机构的研究方向、整体实力、所处地位、 合作对象及其差异等方面的数据,了解不同机构 在研究领域、研究成果、前沿识别、认可度等方 面的基本状况,并根据不同高产机构的研究前沿 成果调整选题策略,结合自身的定位和受众情况 有的放矢规划选题。也可根据主要国家(地区) 研究前沿及侧重从内容到时间分布上的特点及其 与全球整体研究前沿的对比结果,判别出其在引 领、同步与追赶全球趋势过程中所处的不同位置 及其发展走向,从而探测到研究前沿的成果分布 状况和基本走向 [6]。只有利用大数据和人工智能 技术实现研究领域的点面兼顾,才能保证科技期 刊研究前沿探测的精准性和科学性。

  4.2 选题策划之新兴研究领域发现优化

  随着学科交叉的不断深入和互联网的不断发 展,新兴领域、新型研究主题的出现频率和传播 速率都在急剧提升。对新兴研究领域的准确和及 时把握是新一轮科技革命中赢得主动的关键之举。 通过对相关领域专家发表的科技论文、专著等大 数据进行清洗、挖掘和筛选,利用科学计量学和 统计学方法,探究相关学科领域的内在联系,探 索学科交叉和新兴领域发展趋势的规律和特点, 有助于我们理解新兴领域形成与演进的机理,准 确把握其发展趋势,进而探测到领域内新兴的主 题和研究方向 [7]。利用主题统计模型、新兴技术 跨领域扩散机理模型、文献耦合、共词方法、自 然语言处理技术和基于引文的主路径分析等方法, 从自由文本数据中识别有重要意义的研究主题(词 语),可高效精准探测交叉学科和新兴领域,对科 学进行科技期刊选题策划起到“仰望星空”的效果, 为国家交叉学科发展的战略部署提供重要的决策 支撑。

  4.3 选题策划之专家知识地图构建优化

  选题策划既要找准研究前沿方向、考虑领域核心知识,还需结合作者和审稿专家来源考虑专 家识别和评价等问题。构建融合领域专家的识别 和评价、快速掌握领域核心知识及其研究者的专 家知识地图,对于科技期刊选题策划优化具有很 强的现实应用价值 [8]。随着数据源的增多和数据 量的暴涨,通过传统模式了解和利用专家个人知 识信息、领域专家关联信息等显性知识和隐性知 识的全面数据已经非常困难。在选题策划和约稿 环节如何利用大数据和人工智能技术有效挖掘与 研究前沿相关的作者和审稿专家信息,构建专家 知识地图,也是这一时代背景下科技期刊选题策 划优化得以顺利实行的必要条件。为便于实现现 有数据的合理挖掘,先将专家知识地图构建分为 专家合作关联层和领域术语关联层,再将专家与 领域知识连接起来,通过构建专家与专家、领域 术语与领域术语、专家与领域术语这三种关联, 建立领域专家知识地图的基础模型 [9]。准确的专 家知识地图构建能使选题策划成为有源之水,有 本之木。只有实现科技期刊选题与约稿对象、审 稿专家的快速精准匹配,才能保证科技期刊选题 策划在描述、预测、决策、实施各个环节的科学、 精准、有序。

  4.4 选题策划之研究成果可视化呈现优化

  研究成果可视化呈现可以将纷繁芜杂的多源 科学数据转换成图形或图像显示出来,有利于选 题策划的数据分析和方向决策在更直观、明了的 条件下科学高效完成 [7]。将可视化分析方法应用 于选题策划数据管理,主要是依据科研数据自身 的数据特征,基于元数据模型的多维数据分析方 法,通过数据收集、预处理,分析计算进一步挖 掘数据潜在的关联信息,并利用科研数据、基于 关键词和共词分析的研究热点可视化方法和技 术,结合基于推荐算法的可视化历史浏览方法, 设计实现基于信息可视化的选题策划数据分析平 台,以实现科研数据获取、基础数据录入和科研 成果统计分析等多项功能的可视化管理和维护, 为选题策划的最终决策提供可视化分析结果。目 前,通过网络引文分析软件(Citespace)进行文 献计量学研究是当前科技研究成果数据分析可视 化的主要方式。该方式在研究搜索引擎技术的基 本原理、核心爬虫技术和网页爬取处理流程的基 础上,设计并实现科研成果搜索引擎的信息采集 模块、爬虫爬行模块、信息索引模块、查询结果 检索模块和用户交互模块的归一化,能让人机协 作的科技期刊选题策划智能决策更便捷、直观、 高效。

  4.5 选题策划之受众数据收集与分析优化

  选题策划的“受众思维”,是指在科技期刊策 划环节以受众的需求为中心,围绕受众需求打造 出能满足受众个性化体验并为受众提供增值、创 新化、深层次的服务和产品。相较于受众只能被 动接受信息的传统媒体时代,在大数据全媒体时 代能否准确把握“受众思维”,是科技期刊信息 传播能否顺利进行需解决的一个重要课题。科技 期刊的受众既包含读者也包含作者。全媒体时代 的到来为受众提供了非常灵活宽泛的多样化选择, 受众之间以各种不同的网络合作方式传播思想、 共同创造、协作共享、产销合一的情况也越来越 明显。在科技期刊选题策划各环节(选题、约稿、 组稿、调研反馈等),传统的选题策划更多以编辑 自身的经验和知识来决定选题和稿件的取舍,受 众信息及其需求在这个环节难以体现。但在大数 据全媒体时代,受众的数字化、在线化、碎片化、 个性化需求不断提高,智能化的“以受众为中心” 的组织架构和服务流程便应放在科技期刊选题策 划最重要的位置。若不能及时树立以“受众”为 中心的办刊理念,选题策划流产的可能性就会很 大。结合全媒体时代的受众特征,科技期刊应根 据自身定位和现实状况,结合大数据受众分析结 果,将受众科学合理地分组并针对不同特征的受 众群组成立灵活多样的受众体验联盟,利用大数 据和人工智能进行受众体验预期、在线交互习惯、 研究兴趣、创造能力等不同方面的数据收集与分 析,从而及时精准地感知受众需求、诊断受众的 难点与痛点,然后在选题策划的各个环节以满足 受众需求为引领、以解决受众难点与痛点为目标, 挖掘大数据中与受众密切相关的信息,打造接口 透明、智能驱动、网络协同、客户体验、在线交互、 群体创造的智能化组织 [10],通过大数据和人工智 能双驱动下的网络协同、人机协作和在线交互加 强科技期刊与受众的交流,收集受众反馈的信息 并根据其建议和意见不断改进选题策划及其后续各项工作的质量,通过人与人、人与组织、组织 之间各个维度的数字化和智能化,充分激发选题 策划及后续工作各方的积极性与创造力,真正为 受众提供内容质量高、表现形式丰富、参与体验好、 附加价值高的数字化科技信息服务和产品。

  5 结 语

  在人工智能快速发展的大背景下,大数据的 应用前景已受到世界各国的高度关注。如何利用 人工智能新技术挖掘、清洗和筛选大数据背后的 巨大价值是数据科学时代各国综合国力比拼的一 个重大课题。一系列针对多源异构大数据智能化 处理的新方法、新模型、新趋势的出现,对于科 技期刊利用大数据实现选题策划优化乃至智能决 策有着非同一般的历史意义和现实意义。科技期 刊作为国家科学技术信息传播的主要媒介,其在 大数据和人工智能时代能否利用新技术完成数据 收集、分析、诊断预测的智能自动化和人机协作化, 科技期刊的选题策划是否科学、前沿、高效,对 期刊能否打造自有品牌乃至占领科技信息传播的 制高点有着关键的作用。

  注 释

  [1][ 美 ] 托尼•亨,斯图尔特•坦斯利,克里斯汀•特勒著 ;潘教峰,张晓林译 . 第四范式 :数据密集型科学发现 [M]. 北京 : 科学出版社,2012 :126-157

  [2] 国 务 院 . 国 务 院 关 于 印 发 新 一 代 人 工 智 能 发 展 规 划 的 通 知 [EB/OL].[2019-05-20].http ://www.gov.cn/zhengce/ content/2017-07/20/ content_5211996.html

  [3] 向飒 . 人工智能对学术出版流程的再造及知识服务提升 [J]. 中国科技期刊研究,2018,29(11) :1091-1096

  [4] 丁伟 . 新媒体内容生态演进的 8 个方向 [J]. 新闻与写作,2018(11) :78-79

  [5] 周群,化柏林 . 基于多源数据融合的科技决策需求主题识别研究 [J]. 情报理论与实践,2019,43(3):107-113

  [6] 梁丽,谢凤杰,池丽旭,等 . 特定学科热点和前沿主题研究方法实证分析 [J]. 图书馆杂志,2018,37(1):19-26,32

  [7] 王曰芬,曹嘉君,余厚强,等 . 人工智能研究前沿识别与分析 :基于领域全局演化研究视角 [J/OL].[2019-05-17].http :// kns.cnki.net/kcms/detail/11.1762.G3.20190517.1135.002.html

  [8] 潘有能,贺焕振 . 基于合著与引用加权的专家知识地图构建研究 [J]. 情报杂志,2018,37(8):128-132

  [9] 宋小康,何劲,王曰芬 . 大数据驱动下情报研究知识库构建的关键技术及实现 [J]. 情报理论与实践,2019,42(1):34-40

  [10] 毕马威 - 阿里研究院 :打造智能化组织 [EB/OL].[2019-05-12].https ://www.vzkoo.com/news/412.html

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号