【摘 要】人工智能技术在数字出版商向智能“知识服务商”转型途中发挥着巨大的作用。智能技术促进人机高效协作、重塑出版流程、增强用户感知、加快我国文化“走出去”的步伐。但人工智能技术与出版业融合深度欠缺、数据化发展不完善、有效供给和服务能力不足等问题阻碍了知识服务生态系统的构建。对此,应构建包含技术突破、扩大资金来源和政策支持的外维生态圈,共筑良好业态环境;构建包含技术与数字出版深度融合、建立行业数据库和提供有效服务的内维生态圈,推动出版知识服务生态系统稳健发展。
【关键词】人工智能;数字出版;知识服务;生态体系
数字经济已经成为拉动经济发展的重要引擎,智能技术使得以数字出版为代表的数字内容产业持续迸发巨大活力,在承担发展新责任的同时,数字出版面临发展新机遇。国际上,大型出版商持续开展数字化业务转型,通过精简结构、降低成本、优化布局等方式,积极调整业务布局,加强科技研发。[1]在我国,数字中国和网络强国建设已上升为国家顶层设计,数字出版正经历快速增长阶段。截止2017年底,我国数字出版累计用户规模达18.25亿人(家/个),营业收入达7071.93亿元。[2]数字出版依托互联网,打破时间和空间的限制,加强信息可得性和可用性的同时,也带来了信息爆炸和信息污染问题,造成信息多样性与人们有限的精力、信息复杂性与人们对有效信息的诉求两对突出矛盾。为解决此种困境,国家新闻出版广电总局明确提出,“十三五”期间,我国数字出版产业要朝知识服务为主的新体系转型。因此,构建以用户需求为中心,提供知识内容和解决方案的知识服务体系成为数字出版发展的未来方向。
根据赛迪公开数据显示,2015年人工智能全球市场规模达1683.9亿元,预计2018年将逼近2700亿元,年复合增长率为17%。[3]2017年7月,国务院印发《新一代人工智能发展规划的通知》,人工智能正式上升为我国国家发展战略,掀起一股“人工智能+产业”的实践热潮。数字出版主动拥抱人工智能,创新出版形式,加快智能化进程。人工智能技术提高了知识传播的速度和效率,增强了用户的感知和体验,在此背景下,探讨数字出版知识服务体系的构建成为数字出版发展的高层次需求。
随着人工智能技术走出实验室,学者们纷纷开展“人工智能+出版”相关探索。知识服务是数字出版未来的重要发展方向,是从内容提供商向知识服务商转型的重要途径。[4]知识服务呈现出全方位的变革,其智能化特征将随着技术的创新升级持续发酵,呈现出知识服务的全新生态体系。[5]目前,人工智能技术在教育出版、专业出版和大众出版领域得到广泛应用,[6]出版商根据人工智能分析结果,为用户提供个性化的知识服务,[7]极大提升了出版的知识服务能力,实现知识服务行为智能化、思维智慧化、场景可视化、途径多元化和传播生态化。[8]
一、人工智能技术对数字出版知识服务的重塑
(一)人机协同高效生产
智能技术利用其在信息采集、数据处理、组织内容和文字规范化处理等领域的优势,将编辑从简单、繁琐的工作压力中解放出来,把时间和精力投入到人类智能擅长的领域中去,实现工作效率的飞跃。
“知识树”是龙源数媒旗下的人工智能平台,最大特点是能辅助编辑。当编辑对一部分内容进行定义后,系统自动组成剩余部分,同时利用积累的文章数据,让旧内容焕发新活力。在此帮助下,编辑一个半小时编辑一本书,一天时间实现发行,极大缩减了出版流程,提高了出版效率。[9]今日头条将人工智能技术应用于内容审核,对低俗图片和“标题党”内容进行自动拦截,截止2016年底,对低质低俗内容的识别准确率为80%,标注图片样本110万,低俗视频样本1万,拦截率较纯人工拦截提高了73.71%。[10]
(二)重塑出版流程
人工智能重塑了数字出版的选题策划、内容生产、营销分发等环节。在选题策划环节,人工智能可以实时抓取社会热点、行业信息,依据用户行为数据绘制用户画像,深度挖掘用户实际和潜在需求,搭建知识图谱,构建销售预测模型,进而精准定位选题内容。该技术的应用使得选题策划具有客观性、科学性和全局性,能有效应对起伏不定的市场需求和同质化的行业竞争,降低出版风险。利用人工智能的算法模型,德国出版公司Inkitt对读者的阅读模式进行分析,能预测到不同图书的市场效果,为作者和出版社选题策划提供参考。[11]
在内容生产环节,人工智能实现内容自动化生产,尤其在新闻写作领域彰显无限优势。2017年8月8日,四川九寨沟地震后,中国地震台网机器人仅用25秒即完成并发布了首篇速报,其效率为媒体界惊叹。[12]今日头条的新闻机器人“张小明”能在2秒内完成稿件并上传发布,语言拟人化程度高,不仅能发布短讯,还能生成简报类长文章,且实现自动起标题、匹配摘要、封面图自动读取等功能。[13]在文学领域,智能机器人展开探索。长篇小说《真爱》是俄罗斯AstrelSPb出版社推出第一部由机器人创作的小说;日本机器人创作的短篇小说《计算机写小说的那一天》入围文学奖。[14]
在营销分发环节,借助“大数据+算力+算法”,人工智能以市场需求为导向,重塑出版业商业模式,主要体现在三个方面。
第一,实现精准推送。人工智能利用算法收集海量用户数据,包括用户活动区域、阅读载体、阅读内容、阅读时间分布和时长等,用算力对大数据进行分析计算,描绘用户画像,为读者进行个性化推送,实现精准营销。今日头条为每位用户都建立了一个高维的向量表,通过智能技术知道用户在什么时候想看什么,能精准对接目标群体,满足用户个性化需求。
第二,指导企业按需生产。人工智能技术结合大数据和按需印刷技术,以用户偏好定出版主题,以市场需求定产量,平衡市场关系,推动数字出版供给侧结构性改革。中国图书进出口(集团)总公司建立了“按需印刷中心”,以全球最大按需印刷服务商英格拉姆的技术和营销网络为支撑,实现中国图书的24小时全球直供。
第三,内容个性化定制。借助大数据、精准算法和多样化信息传输渠道,用户也能自主定制内容。2017年,科大讯飞发布了六款智慧教育产品,其学业数据采集平台收集了350亿条学习数据,学生可自主定制个性化学习方案。[15]
(三)全新的用户体验
人工智能技术实现内容的视觉化呈现,以更加生动有趣、简洁易懂的方式展示和解读知识,增加与读者的互动交流,帮助读者深度理解。尤其是VR/AR技术的应用,让用户全方位立体式感受到文字、声音、视频、动画,提高了用户主动阅读和获取知识的兴趣。
人民文学出版社出版的《朗读者》实现了视频、音频与文本的无缝衔接,用户只需下载“朗读者AR”客户端,扫描图书中的任何一张图片,即可观看近1000分钟的视频片段。[16]童书是VR/AR与出版业结合最为密切的领域之一,占据VR/AR出版半壁江山,如北京少年儿童出版社的《恐龙世界大冒险》、中国石油大学出版社的《古意新曲》和广东新世纪出版社的《中国川剧“变脸”:白蛇传》等。[17]
除开发图书资源之外,基础设施方面,全国各地图书馆不断加大数字公共文化设施投入力度。2017年9月,第五届全国出版物馆配馆建交易会现场设置了VR阅读体验馆,戴上VR眼镜阅读《云冈石窟佛造像》,能看到大小1:1的佛像。2018年3月,河南省邓州市图书馆通过搭建“春节家庭院落”VR场景,开展“戌狗迎新”VR虚拟现实体验活动,如燃放烟花爆竹、贴春联、书写福字、张贴剪纸等春节文化民俗,增强用户对传统文化的了解与热爱。[18]
(四)推动我国文化“走出去”
出版业的根本任务就是传播文化,传承知识。数字出版打破了时间空间的限制,人工智能技术使得我国优秀传统文化的传播和发扬有了新的载体和形式,这将是我国文化“走出去”的一项创新路径。2018年,红色地标(北京)文化传播有限公司联合北京人民教育出版社,承担的《千年长河——京杭大运河上的文化地标VR》项目被列为文化产业发展专项资金重大项目;同年与中国出版集团华文出版社联合承担的项目《基于VR/AR等新媒体技术的中华优秀传统文化创造型传承工程》,成功申报2018年原国家新闻出版广电总局改革发展项目库入库项目。
在全球化持续深入的今天,语言差异等原因带来的文化折扣问题不容忽视,加之翻译人才匮乏、出版具有时滞性,国内出版产品走出去的道路愈加艰难,导致国内信息传播与国际步伐出现错位和脱节。人工智能的深度学习技术助力翻译出版工作,加快了我国出版产品“走出去”的步伐。《极简区块链》是首部由人工智能机器人完成翻译、人工校对的图书,由网易有道公司联合电子工业出版社出版,图书共20万字,从输入原文到翻译输出耗时不过半分钟。[19]
二、人工智能助力构建数字出版知识服务生态体系的内在机理
人工智能技术的深层突破和广泛应用,助力数字出版向“知识服务商”转变,呈现出智能化、深度化的全新知识服务生态模式。人工智能技术将知识内容以更具体、生动形象的方式呈现,在特定的时空和场景下,满足用户实际需求,挖掘潜在需求,提供一系列知识服务方案。在智能技术的带动下,知识服务的服务思维和模式向多样化与智能化转变。人工智能技术将颠覆性地构建起知识服务生态体系,实现技术层面和思维层面的转型。
建立知识服务生态依赖的关键技术是深度学习技术,即把知识从数据中提取出来,包括技术、数据和算法3项关键因素。技术是发展的基础,数据是重要的投入要素,算法能快速处理数据。[20]对应的,人工智能助力构建数字出版知识服务生态系统的关键要素也有3项:智能技术、生产数据、有效服务。其中,智能技术是发展的物质基础,包括云计算、大数据、VR/AR等,智能技术与数字出版深度融合,推动出版流程智能化,不断更新知识和服务的表现形式;生产数据是重要生产要素,包括行业数据、内容产品数据、用户行为数据等。物联网技术实现数据实时抓取和更新,不仅帮助知识服务与用户的精准匹配,还能用于产品再生产,满足用户的潜在需求,形成资源的闭路循环生态系统;有效服务是发展目标,在技术和数据的帮助下,依靠算法对数据的分析处理结果,知识服务需求和供给实现无缝衔接、精准匹配,满足用户的个性化需求,降低生产成本。因此,智能技术、生产数据和有效服务构成了数字出版知识服务生态体系建设的内在机理。
(一)智能技术是推动引擎
建立高效有序的生态模式,智能技术是重要推动力。近年来深度学习、智能算法等人工智能技术在数字出版领域的不断尝试,打破了出版业的传统思维桎梏。以纸媒为载体的、单向的知识提供模式转变为以互联网为载体,以人工智能技术为依托,以服务为竞争力的知识服务生态体系。搭乘人工智能技术的快车,构建生态体系是数字出版知识服务的高层次要求。智能技术在信息数据抓取、整理分析和感知体验方面有着绝对优势,在保证数字出版内容的开发质量的同时,能满足用户的多样需求,降低内耗成本,实现知识生产商、知识发行商、知识开发商和用户的多方共赢,其必将成为持续引爆数字出版活力的强劲动力。因此,面对人工智能新一轮技术革命,学会运用智能技术,循环利用资源,以科学化、生态化为最终目标发展,为我国数字出版的知识服务生态体系构建注入新的发展动能。
(二)生产数据是主要生产要素
信息技术通过将产品内容用“0”和“1”进行编码,实现出版业数据化,缩小了储存空间,避免信息失真。知识服务生态体系的构建需要整合融通多层次的数据,包括行业数据、产品数据和用户数据,实现各出版单位之间的数据连通与共享。通过数据循环和信息实时反馈,知识产品得以按需生产、精准匹配。除此之外,国家宏观数据、世界精神文明素材和各国人文风俗资料也应纳入生产数据中,准确利用这些数据,打破数字鸿沟和文化折扣问题,提供有效服务,实现知识在全球无障碍传播,加速人类走向万物互联的普惠时代步伐。
(三)有效服务是最终目标
构建知识服务生态体系的最终目的在于实现知识服务个性化和有效化。利用云计算、算法等技术,对海量数据进行分类统计,并结合抓取的用户信息、使用场景和行为规范进行针对性分析,能有效明确用户的当前需求和潜在需求,提高知识服务的质量和效率,减少无效产品的生产,提升用户体验,增加用户忠诚度和粘性。尤其是智能技术在“反馈”环节的应用,能有效提供个性化知识服务。
三、人工智能助力数字出版知识服务生态体系构建的现实困境
(一)人工智能技术与出版业融合有待深入
2014年2月,国务院出台了《关于推进文化创意和设计服务与相关产业融合发展的若干意见》,表明文化产业融合发展已是大势所趋。目前我国媒体融合发展由全面铺开阶段迈向深度融合阶段,数字出版向“知识服务商”转型发展也应迈向高质量发展的高层级。人工智能技术在出版业应用的目的是为了帮助人类更加快速高效地掌握知识,但有些出版商本末倒置,将智能技术和智能终端当成卖点,仅更换产品内容表达方式,并未对内容进行深耕。高昂的价格和低质量的内容形成强烈反差,让用户产生“华而不实”的想法,丧失对产品的信心。当前产业环境变化迅速,新技术层出不穷,新商业模式快速迭代更新,用户需求呈现个性化,数字出版与人工智能技术的深度融合任重道远。
(二)数据化发展不全面
知识传播以信息方式存在,即信息是人类文明传承的重要载体。随着互联网通信技术的发展,信息获取和存储朝着数字化、网络化方向发展,数据成为信息的代名词。在数字出版领域,数据化发展并不全面,表现为进程缓慢和应用不完全两点。
数据化进程缓慢表现在两方面。其一,传统知识资源,如古籍、音乐、辞书等数量太过庞大,加上众多知识资源具有保密性,数据垄断和数据孤岛现象严峻;其二,虽然一些出版巨头已经展开积极尝试,大部分出版商运用智能技术意识相对淡薄,并未做好拥抱智能技术的充分准备。
数据化应用不完全同样表现为两方面。其一,数据化多体现在知识服务流程的“采、编、发”三环节,在“市场效果”和“用户反馈”环节尝试较少,且未能将这些数据用于再生产,无法形成良性循环数据利用系统;其二,行业各主体,如出版商、生产商、发行商等基本处于单兵作战、各自为政的状态,鲜有合作共享信息、协调发展的成功案例。
(三)有效供给和服务能力不足
我国出版内容品种丰富,数量较多,出版能力先进,但知识的认知性和创新性不足,一般化产品居多,优秀作品缺乏,精准服务欠缺,[21]表现为出版结构性问题与服务意识缺乏。
知识供给侧与需求侧失衡导致出版结构失衡,集中表现为选题同质化现象严重。2016年,在200余种VR/AR童书中,书名包含“AR涂色”的占40余种,与恐龙题材相关的也有40多种。[22]大部分数字出版商将知识的载体从纸媒转变成互联网,这种类型的知识产品从生产之初就缺乏针对性,仅将内容进行简单的数字呈现,缺乏对知识的深度开发与挖掘,同一内容用多种形式重复表达,未能实现字、声、图、动画的互补互充,忽略该种产品的市场需求及产品的吸引力。
服务意识方面,以出版商为中心的“一对多”单向知识传播模式依旧占据主导地位。大部分出版商的思维仍停留在“内容提供者”阶段,“以用户为中心”意识淡薄,个性化服务水平和能力均有待提高。此外,与行业其他各主体之间的联动思维不足。
四、人工智能构建数字出版知识服务生态体系的途径
2015年9月,国务院发布的《促进大数据发展行动纲要》提出,要建立国家知识服务平台与知识资源服务中心,加快推进专业化知识服务平台建设,聚集专业领域数字内容资源,分步式推进知识资源服务的基础设施,整合各领域知识数据平台,形成层次清晰、覆盖全面、高度关联、内容精准的知识库群,重新构建知识价值服务体系。数字出版知识服务生态体系的构建不是一蹴而就的,需要业内业外共同努力,才能实现资源的循环利用,促进数字出版朝着智能化、科学化、生态化方向发展。针对此,本文构建了人工智能技术下数字出版知识服务生态体系,如图1所示。

图1 人工智能技术下数字出版知识服务生态体系
(一)外维生态圈:“技术突破+资本+政策”共建业态环境
1.持续技术突破。
人工智能技术的研发目的在于模拟和延伸人类智能,帮助人类认识和改造世界,更好服务于人类。目前人工智能技术处于发展的初级阶段,可以依据人类事先编辑的程序,通过收集分析数据解决问题,代替出版活动中某些机械性、重复性的工作,在未来可为整个出版产业管理、意识形态监控提供决策支持服务。这就需要继续研发自然语言理解、机器学习、数据挖掘、深度学习、知识图谱等多项技术。政府应加大对人工智能技术与知识服务融合发展的技术支持。同时,出版业应积极联合专业智能技术公司,加速迈向推理、思考和全自动化出版的强智能阶段。
2.充分利用资本杠杆。
自2016年《资产评估法》开始实施,版权资产作为无形资产被纳入其中,版权资产评估行为得到有效规范。因此,应建立完整的版权评估指标体系和评估方法,让版权作为重要的无形资产明确其市场价值定位,通过高效管理运营,实现版权资产和资本的有效衔接,充分挖掘和释放其潜在价值。此外,建立文化产业政府引导基金,用资本力量撬动文化市场。积极寻求多样化融资途径,开发新型版权质押模式。
3.强政策引导。
出版商应主动将国家关于文化繁荣的整体部署和政策方针落到实处;政府要紧跟时代发展形式,根据业内新形势、所处新阶段、着眼于市场新形势,培育新动能,有针对性地制定行之有效的产业政策。除此之外,还应加大对人工智能技术的支持力度,完善基础设施建设,出台优惠金融政策,积极拓宽对外交流渠道。
(二)内维生态圈:“技术融合+数据+服务”推动生态构建
1.技术层面:推进智能技术与知识服务深度融合。
面对人工智能浪潮的冲击,出版机构应主动出击,转变出版思维,以积极的姿态接纳人工智能技术,探索出版业知识服务生态体系构建,与人工智能企业进行深度交流合作,探索符合自身发展模式的生态路径。各出版单位之间应建立技术共享互联思维,打破相互独立发展的模式,互通有无,走集约化发展之路。
2.数据层面:建立行业数据库,活跃数据应用。
构建有效数据库主要包括三个层面:一是宏观数据,主要包括国民经济相关生产活动与生产需求数据,为出版单位制定运营规划提供依据;二是中观数据,即与数字出版和知识服务相关数据,包括知识服务内容资源数据、信息内容产品数据、市场数据及营销渠道反馈等数据,为出版单位确定产品定位和经营策略提供依据;三是微观数据,即与出版单位产品运营直接相关的数据,包括竞品数据等。该类数据为总结自身优势和短板,进行产品竞争力分析,着力寻求产品竞争的关键点,优化产品运营方式提供依据。
比建立数据库更重要的是让数据“活”起来。实时抓取各用户群体在不同场景、不同时间的用户行为信息,加上用户在体验知识服务时的偏好及反馈意见,形成新的数据库,将该数据用于产品再生产,在注重内容创新的同时,充分挖掘优质内容的潜在价值,运用新媒介、新形态、新模式,不断创新内容的表现形式,真正实现“以用户为中心”。
3.服务层面:深耕知识内容,构建服务生态。
数字出版商要不断强化用户服务意识。当下,“以用户为中心”不再是简单地将产品内容用智能技术推送给用户,而是需要服务者真心诚意地与用户进行充分交流与沟通,将内容打磨成值得用户兴奋、激动、原意与人分享的产品,增强用户对内容产品的信任;不是只关注销量,而是反思改进运营方式,让用户有良好的体验和满足,增加产品的用户粘性,建立产品与用户之间的情感关联与利益契合。
同时,出版商要根据用户个性化需求,不断创新服务模式,提供精准服务,构建完善的创新运营体系,做到精准定位、精准发力、精细化管理。着力提升知识服务的文化品位和思想格调,丰富知识内容的文化内涵,持续挖掘“走出去”有效途径,积极开展与海外出版机构的合作,通过多元化版权运营,在世界舞台讲好中国故事,提升我国出版业的国际影响力和竞争力。
人工智能前景无限,随着智能技术与数字出版业的融合逐步走向深化,智能技术将更好地为人们提供知识服务。同时,应辩证看待人工智能技术与数字出版之间的关系,保持理性的认识。人工智能技术作为推动构建知识服务生态体系的重要引擎,为数字出版业的转型升级带来诸多发展机遇的同时,也带来了巨大的冲击和影响,如版权问题,隐私风险。目前,市场上炒作人工智能概念、伪创新泛滥的不良现象比比皆是,《人民日报》曾专门发文批评人工智能泡沫。数字出版业应理性看待“人工智能热”,不过分依赖,不夸大其词,擦亮双眼,去伪存真,既不错失机会,也不盲目跟风。只有两者相互协调,优势互补,才能实现人工智能与数字出版转型升级的共赢,加速构建知识服务生态体系,让人工智能真正造福出版业。
参考文献
[1][2][16][17][18][19][20][22]张立.2017-2018中国数字出版产业年度报告[R].北京:中国书籍出版社,2018.
[3]乌镇智库.乌镇指数:全球人工智能发展报告(2017)(框架篇)[EB/OL].https://knogen-auto.oss-cn-beijing.aliyuncs.com/pdf/AI-China20170726.pdf,2017-7-27.
[4]王晓光,金秀坊.数字出版何去何从——2017年数字出版研究综述[J].出版广角,2018(3).
[5]王垚.数字出版生态体系的构成与完善——2018年我国数字出版盘点[J].出版广角,2019(3).
[6]王卉,张瑞静.知识付费浪潮中出版业转型升级的创新与坚守[J].出版发行研究,2018(7).
[7]姜春辉.人工智能技术与出版的融合探析[J].出版广角,2018(3).
[8]向飒.国外科技期刊出版集团的经营特色和盈利模式分析[J].出版广角,2017(6).
[9]人工智能赋能出版业:一天编辑一本书,找选题更容易[EB/OL].https://baijiahao.baidu.com/s?id=1574045407121295,2017-7-27.
[10]揭秘今日头条“网络安全委员会”,人工智能如何让网络更安全[EB/OL].http://www.chinaz.com/news/2017/0601/714330.shtml,2017-6-1.
[11]ALBAZAZ A.How inkitt publishes your books:from preparation to promotion[EB/OL].https://www.inkitt.com/writersblog/how-inkitt-publishes-your-books-frompreparation-to-promotion,2017-5.
[12]九寨沟县发生7.0级地震,机器人25秒写新闻[EB/OL].http://www.sohu.com/a/163298412_612768,2017-8-9.
[13]拿下中国人工智能最高奖今日头条写稿机器人有哪些黑科技[EB/OL].http://tech.ifeng.com/a/20171226/44820741_0.shtml,2017-12-26.
[14]杨舒怡.情节无破绽!日本机器人写小说入围比赛初审[EB/OL].http://www.xinhuanet.com/world/2016-03/24/c_128827024.htm,2016-3-24.
[15]怡彭.科大讯飞:发布六款教育产品,已收集350亿条学习数据[EB/OL].https://www.jiemodui.com/N/85948.html,2017-11-9.
[21]刘建生.传统媒体与新兴媒体融合发展的途径探讨[J].电视指南,2017(11).