业内信息

面向用户的科技期刊智能内容生产模型构建

2020-08-08 来源:《中国科技期刊研究》
  【作 者】王传清、翁彦琴:中国科学院文献情报中心;袁国华:河南师范大学

  【摘 要】[目的] 从面向用户的视角,研究人工智能技术在科技期刊内容生产中的应用路径与方法。[方法] 通过分析个性化和智慧化的用户需求及相应智能技术,基于系统模块思想,利用系统构建方法及流程设计构建面向用户的科技期刊智能内容生产模型。[结果] 所构建的模型以用户为中心,通过对用户属性数据和行为数据等的多元融合进行用户画像,再通过与期刊资源进行语义匹配来实现面向用户的科技期刊智能内容生产。[结论] 科技期刊在具体场景中可以利用所构建模型,分步骤、分阶段实现面向用户的智能内容生产。

  【关键词】智能出版;智能内容生产;科技期刊;用户服务;知识服务;人工智能;应用模型

  自2017年国务院颁布《新一代人工智能发展规划》后[1],2018年10月31日,习近平总书记在中共中央政治局第九次集体学习时强调要推动我国新一代人工智能健康发展[2],并提出以人工智能为基础,促进科技向经济社会各领域渗透,提升各行业的运行效率,促进生产、制造、营销、服务等过程的自动化、智能化。人工智能(Artificial Intelligence,AI)已成为国家创新战略的重要内容,科技期刊出版与人工智能技术结合具有先天优势,人工智能不仅可以提升科技期刊的出版质量,加速学术传播[3,4,5],还可以大幅提升科技期刊出版的知识服务能力[6,7]。因此,“出版+人工智能”将会成为未来发展趋势[8,9,10],其中,科技期刊的智能内容生产将是未来出版的新模式和新形态[11,12]。

  从科技期刊的用户来看,一方面科技期刊论文数量爆发式增长,科技期刊用户要想靠人工阅读所有的文献越来越困难,据估计,全世界每年有100万篇新论文发表,也就是每30秒就有一篇新论文问世,研究人员几乎不可能阅读本学科领域的所有相关文献[13];另一方面,随着自然语言处理、人工智能、大数据分析、知识图谱等技术的发展,机器在处理大量科技期刊论文方面的作用越来越大。因此,在人工智能时代,科技期刊的用户将由人转变为“机器+人”,大量科技期刊论文可能首先是被机器“阅读”,然后才被人深阅读。“机器+人”的用户转变,相应地要求科技期刊出版内容由可发现向可处理转变[14],实现“人工”与“智能”双向协同的出版转型[15],这给科技期刊实现智能化内容生产带来了多方面的挑战[16]。而科技期刊的传播最终是要通过用户(受众)的接受来完成。用户是科技期刊传播的对象,也是科技期刊生存的基础,面向用户是科技期刊发展的前提,科技期刊应该引入人工智能等技术,满足用户对于智能化内容生产的需要。因此,从用户视角来研究科技期刊智能内容生产具有极其重要的意义。

  1 相关研究

  国外出版社在面向用户的智能出版领域已有不少研究和探索,如德国出版社Inkitt 利用人工智能技术来演算趋势数据、判断用户使用模式、收集读者偏好、修改作品内容,并利用网络数字出版打造口碑,最后再进行实体出版[17]。爱思唯尔为了更好地服务其用户,推出了SciVal、Expert Lookup等一系列分析工具[18]。还有学者研究利用Iris.ai[19]等人工智能工具为科学家们提供与PubMed和Google Scholar等数据库和工具不同的科学文献。

  国内研究方面,笔者在中国知网中以“用户/读者”“期刊”“智能/智慧”“出版/生产”为主题词进行匹配检索,发现从用户角度来研究期刊智能出版的直接相关成果较少,主要有赵鑫等[20]引入Corey Stern的CUBI用户体验模型来分析智媒时代科普期刊用户的需求,并在此基础上提出科普期刊在人工智能时代的创新路径和应对措施。李华君等[21]通过对数字出版用户线下和线上场景感知的梳理,论述了人工智能技术在数字出版场景感知和场景生产中的应用构想。此外,在探讨人工智能与期刊出版相结合的一些研究中提到选题策划应以用户需求为导向[12],利用智能技术优化学术不端检测[22],提升论文同行评议质量[23],为用户提供个性化推荐和精准推送[24]、实现“千人千面”的出版[25]等与期刊用户相关的内容。

  已有的研究成果为本研究提供了思路和参考。但由上述分析可知,国内已有研究很少从科技期刊用户的视角,特别是“机器+人”的视角来研究和分析科技期刊智能化生产。用户是科技期刊出版的服务对象和根基,因此,本文在总结已有研究的基础上,引入用户画像(Persona)以及知识标注与组织技术和方法,通过构建科技期刊用户画像模型和科技期刊资源智能组织模型,实现人工智能时代科技期刊智能化生产模型的构建,并对模型的具体实施展开分析,为我国科技期刊的智能化出版发展提供参考和借鉴。

  2 用户服务需求和相应智能技术分析

  人工智能技术的发展和应用,使得用户对科技期刊智能生产服务产生了更高的要求,可归结为个性化和智慧化两大方面。

  2.1 个性化需求与用户画像技术

  人工智能时代,科技期刊用户要求期刊出版的内容不再是“万人一面”,而是“万人万面”,要能对用户进行细分,根据不同研究领域的用户差异,根据不同时间、不同地点、不同情境下用户利用期刊资源的差异,采用适合的推荐算法进行计算,匹配适合的期刊出版内容,满足用户个性化需求,提供个性化出版内容和服务[26]。

  科技期刊要面向用户,首先需要了解和细分用户。面向用户的科技期刊智能内容生产,需要在进行用户画像的基础上实现智能内容策划。用户画像即用户信息标签化,通过收集、整理与分析用户的基本属性、专业背景、行为数据等与用户需求相契合的信息,以此为基准进行模型化构建,了解用户的信息全貌。科技期刊用户在信息需求的驱动下访问期刊网站,网站服务管理系统将感知、识别、整合用户浏览、检索、下载期刊论文等过程中产生的数据痕迹,并上传数据处理层,经机器处理技术、数据挖掘、社会网络分析等进行过滤、清洗和组织。对数据进行加工存储,抽取用户特征来构建用户模型,运用分类、聚类、回归、预测等技术深度挖掘用户对相似信息的利用、收藏等行为,计算不同用户之间的相似程度并以可视化的形式突出易懂、易用的个体以及用户群体之间的用户画像。

  2.2 智慧化需求与资源智能组织技术

  科技期刊用户要求期刊出版的知识内容更加智慧化。用户可以按照自己的需求来摘取期刊资源的一部分内容或是重新组织期刊出版内容。当科技期刊智能生产将出版内容细粒度化、语义化、关联化,并给期刊用户提供了这些出版内容的可视化操作权限,用户可以通过手机或智能可穿戴设备的连接,置身于期刊论文的内容场景,甚至可以输入自己的数据在阅读论文的过程中开展科学实验,让研究结论和发现更有针对性。这样,科技期刊智能内容出版的产品已经超越了普通意义的文档,不再是冷冰冰地传递信息和知识,而是成为拥有智慧且能与期刊用户一起思考、分析和创新的伙伴。

  科技期刊若要将出版内容细粒度化、语义化、关联化,就需要掌握和分析智能内容策划、智能内容审校、智能内容标注及组织等具体应用所需要的人工智能技术和方法,包括但不限于研究热点和前沿的智能分析软件工具、内容推荐技术、命名实体自动识别技术等。

  (1) 研究热点和前沿的智能分析软件工具。目前用于研究热点和前沿的分析软件较多,如CiteSpace[27]、Thomson Data Analyzer (TDA)[28]、Ucinet[29]、BICOMB[30]等。有的研究者只采用一种软件,有的研究者综合几种软件来分析文献中作者、作者机构、关键词、期刊等重要信息,同时也可以挖掘和分析它们之间的相关性,找出学科领域演进的关键路径,了解和扫描科学技术的发展现状和趋势等。

  (2) 期刊内容自动推荐智能技术。①基于内容的推荐。根据用户过去的信息行为,抽取用户的兴趣特征,同时提取科技期刊论文等信息当中的有意义特征,计算这两者之间的相似度,选取相似度高的信息推荐给用户。这种方法的优点是用户之间相互独立,方法本身有良好的解释性,可实时推荐新的科技期刊论文等信息;缺点是用户兴趣和信息目标的特征提取难度大,对没有任何信息行为的新用户存在冷启动问题。②协同过滤推荐。根据用户的历史行为、兴趣、职业、年龄等特征,分析计算用户之间的相似度,根据与目标用户最相似的N个用户对信息目标的加权评价值,预测目标用户对科技期刊论文等信息的评价值,从而为用户推荐科技期刊论文等信息。这种方法的优点是能够帮助用户发现潜在的用户自身不清晰的兴趣爱好,即能起到个性化推荐的作用,用户之间关联性强;缺点是对于历史行为较少的用户群体,由于数据稀疏难以寻找到相似用户,而对于没有历史信息行为的新用户,同样存在冷启动问题。③基于深度学习的推荐。深度学习来源于人工神经网络的研究,普通的深度神经网络可被视为多层人工神经网络的叠加,而其扩展模型如卷积神经网络(Convolutional Neural Networks,CNN)[31],针对图像、文本等数据的性质,设计了特别的网络结构。卷积神经网络主要由输入层、卷积层、池化层、全连接层、输出层组成,其网络结构的特殊性表现在它的神经元之间为非全连接且同一层中部分神经元之间共享连接权重,这就降低了网络模型的复杂度,减少了权值的数量,使其可以捕捉细小的特征信息。通过CNN获取科技期刊论文信息特征的深度学习过程为:首先将文本信息表示为n×k的词向量矩阵;其次使用多个卷积核在词向量矩阵上进行卷积操作得到特征图;然后对特征图采用时间维度上的最大池化操作;最后通过全连接层输出文本信息的特征。

  (3) 命名实体识别技术。科技期刊出版内容的细粒度化、语义化、关联化离不开对内容的命名实体识别。科技期刊资源的自动组织及智能审校都需要利用命名实体识别技术。命名实体识别也被称为专有名词识别,其主要任务就是识别文本中存在的人名、地名、机构名等专有名词。①基于规则的命名实体识别。基于规则的命名实体识别方法一般是通过观察大量命名实体总结出命名实体构成上的语言学规则,然后将文本与规则进行匹配来实现命名实体识别。其中所用的规则和词表等的准确性、科学性、丰富性直接影响命名实体识别的效果。所有规则和词表主要由人工构建,由于不同领域的差异较大,并且考虑到语言本身具有的复杂性,人工构建这些规则和词表耗时耗力,且全面性难以保证,所以基于规则的命名实体识别成本较高。②基于特征模板的命名实体识别。基于特征模板的机器学习方法主要有最大熵模型、支持向量机(Support Vector Machine,SVM)模型、隐马尔可夫(Hidden Markov Model,HMM)模型和条件随机场(Conditional Random Field,CRF)模型[32],其中条件随机场模型表现较好,使用频率较高。通常情况下,基于命名实体的词法、句法以及上下文信息来构建特征模型。与基于规则的方法类似,特征选择对于模型预测的准确率有至关重要的作用,因此如何构建和选择出合适的特征模板是解决科技期刊文本命名实体识别问题的关键和挑战。③基于深度学习的命名实体识别。词的分布式表示(Word Embedding)和基于循环神经网络(Recurrent Neural Networks,RNN)的语言模型出现后,基于深度学习的方法在解决序列标注问题上显示出独特优势,深度学习模型的输入为字向量,经过几层非线性激活运算后给出每个字的分类标签,因而无需人工构造特征模板。基于双向循环神经网络(Bidirectional Recurrent Neural Networks,BI-RNN)[33]的模型还考虑了同层之间较远距离节点间的影响,与传统机器学习的方法相比,该模型更适合解决序列标注问题。基于深度学习的方法需要大量标注完全的语料作为训练集,前期需要大量的人工标注工作,这是制约这类方法使用的一大难题。

  3 科技期刊智能内容生产模型构建及实施

  在分析具体应用中可以用到的相关人工智能技术和方法的基础上,本研究开始构建面向用户的科技期刊智能内容生产模型,包括三个阶段:第一个阶段是科技期刊用户画像模型构建;第二阶段是科技期刊资源智能组织模型构建;第三个阶段是在科技期刊用户画像模型和科技期刊资源智能组织模型的基础上,根据用户特征设计科技期刊智能内容生产模型。

  3.1 用户画像模型

  (1) 用户画像数据类型。“互联网+”和大数据技术的出现,促使科技期刊资源间的互联、协同达到移动的深度和广度,移动终端设备的广泛应用带来了多领域、全方位的用户数据,对科技期刊的用户而言,用户画像是用户信息全貌的抽象,其核心是将用户信息标签化,易理解、便于处理。绘制用户画像的数据资源主要包括用户基本信息数据、用户期刊资源利用数据、用户社交及互动数据、第三方开放数据等。用户在期刊网站注册时的个人基本属性信息如姓名、性别、年龄、单位、专业、学历等属于静态数据,可利用用户静态数据集对用户基本信息进行识别判断;用户行为记录信息、期刊资源平台利用情况、用户社交互动信息、访问移动终端等产生的数据是动态数据,可及时更新用户的动态数据对用户的行为信息进行判断。通过全面收集、整理每个用户的静态数据和动态数据,提高期刊为用户提供服务的准确度。

  (2) 用户画像的数据采集。如何采集个性化用户数据是构建用户画像的关键,在数据采集过程中,坚持全面、精准、价值密度高等原则,确保小数据能够全面、准确地反映出用户的特征、阅读行为以及用户价值等属性。用户画像数据采集包括用户注册时的基本信息、用户使用的资源数据、社会活动数据等,以及用户对期刊资源需求的相关预测数据。

  科技期刊拥有庞大的作者、读者群体,用户画像的数据信息采集方式有:①根据用户注册、登记的信息采集用户的姓名、性别、单位、专业、研究方向、兴趣爱好等特征数据;②通过数据库中用户日志、期刊借阅系统、网络监控系统、传感器设备、RFID、期刊管理系统等采集用户的期刊论文查询、阅览新刊、写作培训、期刊借阅、推荐论文、期刊数据库登录次数、信息收藏、检索下载文献、文献标记转发、定题服务、课题追踪、信息共享等数据,以及用户通过论坛、微信、微博进行的学习交流、合作、心得等数据;③通过第三方服务商协议共享的用户查阅信息采集用户的社会活动数据、用户偏好、移动终端记录等相关数据。利用科技期刊统一的用户画像数据管理模式、数据采集设备,全时空、多渠道的人机物三元交互技术,并通过数据挖掘技术分析以及系统cookies来动态掌握用户信息的变化过程,进行相关的过滤、去噪、映射等技术处理,让以用户为中心的数据之间不断互补完善,为每个用户建立个人数据记录,经过分析、清洗、聚类、标准化处理等,滤除用户画像数据中的错误、低价值及无效数据,提升采集用户画像数据的标准化程度,有效建立用户画像数据和用户画像的映射。用户画像数据来源及采集方式如表1所示。


表1 用户画像数据来源及采集方式
数据来源 数据构成类型 数据采集方式
用户基本信息数据   姓名、性别、年龄、单位、专业、ORCID、学历、特长爱好、住址信息等   用户注册登记系统、期刊用户特征信息库
用户期刊资源利用数据   期刊论文查询、阅览新刊、写作培训、期刊借阅、推荐论文、期刊数据库登录次数、信息收藏、检索下载文献、文献标记转发、定题服务、课题追踪、信息共享等   数据库用户日志、期刊借阅系统、网络监控系统、传感器设备、RFID、期刊管理系统
用户社交互动数据   论坛、微信、微博、在线浏览、学习交流、科研合作、网上学习、学习心得等   爬虫工具、可穿戴设备
第三方开放数据   社会活动数据、用户偏好、移动终端记录等   企业、数据库商、第三方合作单位

  (3)用户画像模型构建。用户画像模型包括用户数据层、用户数据采集模块、用户数据分析处理模块和用户画像可视化模块。用户数据层是用户画像的数据来源,可对用户画像数据来源进行有效组织;用户数据采集模块是用户画像数据的基础,通过网络爬虫、文本挖掘以及网站日志等方式采集用户的基本信息数据和用户动态行为数据,按照一定的规则和筛选标准进行数据归类,并存储到不同用户画像数据库中,形成数据库文件,收集整理用户交互界面的反馈信息,根据反馈的信息及时对采集的用户画像数据进行更新;用户数据处理模块是通过数据清洗、数据集成、数据交换、数据归约技术对用户画像原始数据进行预处理,建立用户属性画像数据库和用户行为画像数据库;用户画像可视化模块中的数据标签层是构建用户画像的核心,利用数据分类、聚类、整合、关联等技术,完成用户画像标签建模和用户识别,建立用户标签数据库,对用户的相关数据进行统计分析处理后,形成具有指导意义、易被理解的用户画像信息;可视化层是对用户标签数据库进行语义聚类,建立用户画像数据库,通过可视化形式展示,从用户画像的多维度标签、分类标签反映用户信息的变化,化抽象为形象,并描述用户动态需求。本研究构建的用户画像模型如图1所示。


图1 科技期刊用户画像模型

  3.2 科技期刊资源智能组织模型

  科技期刊智能内容生产模型的第二阶段是构建科技期刊资源的智能组织模型,主要包括期刊资源输入模块、期刊资源语义处理模块、本体知识模块、语义标注模块和存储模块,如图2所示。



图2 期刊资源智能组织模型

  从图2可以看出,期刊资源输入模块可以支持XML、HTML、PDF、TXT、音频、视频等文件,可以人工输入,也可以自动采集,并可以自动检测期刊资源文档,符合条件的文档被提交到期刊资源语义处理模块。

  期刊资源语义处理模块先对期刊资源文档进行预处理,如文档切分、去除停用词(包括标点、数字、单字和其他一些无意义的词)等,通过语法分析,利用类似中国科学院开发的 ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)软件等工具对期刊资源文档进行自动分词,然后提取期刊资源文档的特征向量,并利用本体进行协助提取。与英文文档分词相比,中文文档分词的难度更大,在分词时应借助中文词典以及各学科的专业词典进行分词,以提高分词的准确性。对期刊资源文档完成数据处理后,形成含有特征向量的模型文档,并将其提交到本体知识模块。

  本体知识模块提供了通用本体和专业本体来支持规范术语表示以及异质语义修改。通用本体描述的是常用基本概念及其相互间的关系,例如顶层本体;专业本体描述的是某领域专业知识概念及其相互间的关系,例如领域本体。基于处理后的语义数据训练集进行规则发现、规则生成、规则评估和规则应用,完成语义规则的制定及应用。

  语义标注模块的功能是对期刊资源文档具体实施自动化语义标注,并实现语义页面的可视化呈现及文档发布。标注过程主要是通过页面编辑工具和语义标注插件完成,标注完成后得到元数据知识库。另外,还要对语义标注结果进行反馈,以进一步完善本体的概念、实例、关系等[34]。

  存储模块提供独立存储和嵌入式存储等多种语义文档库存储方式。独立存储主要是采用链接的方法,将期刊资源文档中的实体与其语义描述元数据链接起来,元数据中包括关于实体的类和实例信息,被存放在知识库中;嵌入式存储主要是通过在期刊资源文档中加入标签来增加概念知识相关的语义信息,使得人和机器都可以识别和处理期刊资源语义文档。

  3.3 科技期刊智能内容生产模型构建

  科技期刊智能内容生产的核心思想是将期刊资源适时、主动、有针对性地推送给读者,期刊出版从“以论文为中心”转变为“以读者为中心”。科技期刊在出版过程中借助人工智能技术和方法,根据用户的需求和特征画像,不断为读者提供新的知识和服务。

  本研究所构建的科技期刊智能内容生产模型采用用户触发内容生产和服务器主动推送相结合的方式。通过用户画像模型将用户抽象成一个个虚拟成员,并且对用户的知识领域、知识主题以及知识类型、操作策略等方面进行标签化处理。在此基础上,智能计算模块将用户标签与期刊语义文档库进行语义匹配计算,若有匹配,则将匹配的知识内容形成精细的知识文档,通过智能推送引擎将最终形成的知识文档以互联网、移动平台等方式提供给用户。同时根据用户行为的动态反馈及时更新、优化、完善已有的用户画像数据信息库。

  智能计算模块是整个系统的核心部分,可利用它实现知识的智能计算和匹配。服务器主动推送源于用户画像,通过与期刊资源进行语义匹配来对推送内容进行控制。触发式内容生产以用户信息本体结合用户画像为查询条件,查询期刊语义文档库,为用户提供推送服务。对于新注册的用户,用户画像标签只有注册时的静态标签,系统将根据用户的个性属性,从受欢迎的知识库中为用户生产知识内容。面向用户的科技期刊智能化内容生产模型如图3所示。



图3 面向用户的科技期刊智能化内容生产模型

  3.4 科技期刊智能内容生产模型的实施

  在具体实施中,可采用非关系型数据库Hbase作为数据存储工具,它是以流的方式存储所有数据,具有高可靠性、高性能等优点,底层存储由HDFS提供高可靠性支持,同时可以在低成本的PC Server建起结构化存储集群。分布式计算采用的是基于内存计算的大数据分布式计算架构的Spark。选择Spark的主要原因在于它是基于内存计算,具有很好的迭代运算能力,容错性能好,处理速度快,形成可以部署在大量低成本硬件上集群,对轻量级的数据也可以进行快速处理,具有很好的易用性和兼容性。对期刊资源标注采用人工标注和自动标注相结合的方法,可采用深度学习技术RNN对中文语料进行自动标注,而且RNN对中文处理效果比较好。用户信息分类可采用隐语义模型(Latent Factor Model,LFM)、相互贝叶斯分类等传统机器学习算法进行处理。

  在面向用户的科技期刊内容生产情境下,基于用户画像数据对期刊资源进行匹配计算,被推荐的期刊资源向量空间记为J={j1,j2,…,jn};期刊用户标签中体现的用户行为特征包括用户基本数据、资源利用数据、社交活动数据,以及内容偏好、互动、会话等知识服务信息,历史情景信息和当前情景信息分别记为Context(H)和Context(C),由此提取其中能够表示用户行为的标签,构建科技期刊用户行为标签集:U={u1,u2,…,un};最后计算向量J和向量U的相似度θ=Sim(J,U),并将相似度排名靠前的N个期刊语义文档内容作为用户画像智能匹配推荐结果提供给用户。最终用户得到的可能是科技期刊虚拟专辑,类似于施普林格•自然出版的由机器生成的化学类书籍Lithium-Ion Batteries[35],但更加贴近用户,也可能是经过语义标注的、结构化的数字知识文档,甚至是多媒体知识资源。

  4 结论和展望

  人工智能时代,科技期刊的未来出版趋势必定会朝着智能选题策划、创新内容生产、智能化审编校、智能化传播与智慧服务等新模式和新形态方向发展[24,36-37]。本研究构建的科技期刊智能内容生产模型以用户为中心,通过对用户属性数据和行为数据等的多元融合进行用户画像,在此基础上实现面向用户的科技期刊智能内容生产。该模型较突出的一个特点是以模块化方式设计,科技期刊可以根据自身实际情况分步骤、分阶段来开展实践。例如,有的科技期刊仅有期刊网站的用户数据,则可先依据此部分数据构建用户画像,再逐步扩展到期刊数据库或第三方平台的开放数据,逐渐完善用户画像,进行更细致和精准的内容生产及服务。再如,有的科技期刊只有自己的论文资源且力量有限,可以利用开源软件或与技术服务商合作,将论文资源回溯,进行浅层次的语义标注和组织,为用户提供初级的智能内容推荐;待时机成熟,可考虑与其他力量有限的期刊进行联合,或者加入已具备成熟的智能内容生产模式的科技期刊联盟,实现更具智能化的科技期刊内容出版。因此,本研究的结果丰富了科技期刊出版引入人工智能技术的应用技术与方法体系,为用户服务视角下科技期刊在具体场景中利用人工智能技术实现智能内容生产提供了参考。

  本研究也有一定的局限和不足:首先,本研究主要探讨模型构建方法,未能开展大规模的实验分析和研究;其次,以用户为中心进行科技期刊用户画像时,如何保护用户的隐私,防止用户信息被泄露或被窃取,如何对潜在的用户需求进行预测。这些都是需要进一步研究的方向。相信随着人工智能技术、用户隐私保护技术、深度学习技术的不断发展,通过科技期刊出版界同仁的不懈努力,科技期刊的智能出版和智慧服务将百花齐放,更好地促进科学研究和科技知识传播与交流的进一步繁荣。

  参考文献

  [1]国务院关于印发新一代人工智能发展规划的通知[EB/OL]. [2019-08-16]. http:∥www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.

  [2]习近平:推动我国新一代人工智能健康发展[EB/OL]. [2019-08-16]. http:∥www.xinhuanet.com/2018-10/31/c_1123643321.htm.

  [3]王晓光. 人工智能与出版的未来[J]. 科技与出版, 2017(11):4-6.

  [4]王卉, 张瑞静. 人工智能技术在数字出版中的应用现状与发展趋势[J]. 出版发行研究, 2018(2):45-49.

  [5]李媛. 人工智能时代的学术期刊数字化传播[J]. 中国科技期刊研究, 2019,30(11):1183-1190.

  [6]向飒. 人工智能对学术出版流程的再造及知识服务提升[J]. 中国科技期刊研究, 2018,29(11):1091-1096.

  [7]朱本华, 温优华. 科技期刊智慧出版的实现路径探讨[J]. 中国科技期刊研究, 2019,30(11):1177-1182.

  [8]张新新, 刘华东. 出版+人工智能:未来出版的新模式与新形态——以《新一代人工智能发展规划》为视角[J]. 科技与出版, 2017(12):38-43.

  [9]刘华东, 马维娜, 张新新. “出版+人工智能” :智能出版流程再造[J]. 出版广角, 2018(1):14-16.

  [10]张勇, 王春燕, 王希营. 人工智能与学术期刊编辑出版的未来[J]. 中国编辑, 2019(4):64-68.

  [11]杨志辉. 学术期刊数字化出版到智慧出版的变革[J]. 编辑之友, 2019(1):36-41.

  [12]刘平, 杨志辉. 人工智能构建科技期刊智慧出版模式[J]. 中国科技期刊研究, 2019,30(5):462-468.

  [13]Extance A. How AI technology can tame the scientific literature[J]. Nature, 2018,561(7722):273-274.

  [14]张晓林. 颠覆性变革与后图书馆时代——推动知识服务的供给侧结构性改革[J]. 中国图书馆学报, 2018,44(1):4-16.

  [15]姜海. 人工智能浪潮下美国出版业转型的创新与启示[J]. 科技与出版, 2019(12):19-25.

  [16]陈鸿, 刘育猛, 裴孟. 人工智能与期刊发展融合的机遇、挑战和实践路径研究[J]. 中国科技期刊研究, 2019,30(3):217-224.

  [17]How it works[EB/OL]. [2019-08-18]. https:∥www.inkitt.com/.

  [18]向飒. 国外学术出版集团数字化和智能化发展现状及我国对策建议[J]. 中国科技期刊研究, 2019,30(7):740-744.

  [19]Iris.ai[EB/OL]. [2019-08-18]. https:∥the.iris.ai/explore.

  [20]赵鑫, 刘娜英. 智媒时代科普期刊的用户需求、创新路径和应对措施[J]. 中国科技期刊研究, 2019,30(7):699-706.

  [21]李华君, 张智鹏. 人工智能时代数字出版的用户新体验:场景感知、场景生产与入口把控[J]. 出版发行研究, 2019(5):17-21.

  [22]刘银娣. 学术出版领域的人工智能应用:现状、挑战与应对[J]. 科技与出版, 2019(1):64-68.

  [23]范军, 陈川. 人工智能在欧美学术出版领域的应用及其启示[J]. 河南大学学报(社会科学版), 2020,60(1):144-149.

  [24]张海生, 吴朝平. 人工智能与出版融合发展:内在机理、现实问题与路径选择[J]. 中国科技期刊研究, 2019,30(3):225-231.

  [25]彭兰. 智能时代的新内容革命[J]. 国际新闻界, 2018,40(6):88-109.

  [26]翁彦琴, 王雪峰, 张恬, 等. 科技期刊新兴增值服务模式及启示[J]. 中国科技期刊研究, 2019,30(6):635-641.

  [27]CiteSpace:Visualizing patterns and trends in scientific literature[EB/OL]. [2019-08-06]. http:∥cluster.ischool.drexel.edu/——cchen/citespace/download/.

  [28]Thomson data analyzer free download[EB/OL]. [2019-08-06]. http:∥softwaretopic.informer.com/thomson-data-analyzer-free-download/.

  [29]Ucinet[EB/OL]. [2019-08-06]. http:∥www.analytictech.com/archive/ucinet.htm.

  [30]BICOMB 2[EB/OL]. [2019-08-06]. http:∥202.118.40.8/bc/menu1.html.

  [31]Convolutional neural networks[EB/OL]. [2019-08-10]. https:∥www.coursera.org/learn/convolutional-neural-networks.

  [32]Conditional random field[EB/OL]. [2019-08-10]. https:∥www.sciencedirect.com/topics/computer-science/conditional-random-field.

  [33]Schuster M, Paliwal K K. Bidirectional recurrent neural networks[EB/OL]. [2019-08-10]. https:∥ieeexplore.ieee.org/document/650093.

  [34]王传清, 毕强. 数字图书馆自动化语义标注工具系统模型研究[J]. 现代图书情报技术, 2014(6):17-24.

  [35]瞧,这部学术新著全由机器生成[EB/OL]. [2020-03-10]. http:∥szsb.sznews.com/PC/content/201904/11/content_632538.html.

  [36]孙小琪. 人工智能在出版业知识服务中的应用研究[J]. 出版与印刷, 2019(1):12-17.

  [37]范军, 陈川. AI出版:新一代人工智能在出版行业的融合创新[J]. 中国编辑, 2019(5):64-71.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号