【作 者】曹沁颖 中国人民大学出版社,l00080 北京
【摘 要】本文分析了人工智能这一新技术在出版相关领域的发展,并从编辑职能、选题策划及传播、供应链三个具体方面,提出了出版社应如何应对人工智能带来的变革,分析了要实现这三个应对必须解决的大数据痛点。在此基础上指出,要真正面对技术挑战和社会变革,需要从长期角度改变产业格局,实现产业内和跨产业联盟。
【关键词】人工智能 深度学习 价值发现 大数据 联盟
出版业是一个古老的行业,在漫长的岁月中推动人类知识、观点、文化的传播。近几十年来,互联网技术迅猛发展,其中,人工智能的发展尤为引人注目,大量资本涌人该行业,据统计,中国大陆在AI领域共涉及10亿美元(约合人民币68亿元)202次的投资,规模很大。无数顶尖科学家和技术专家在语言识别、自然语言处理等方面进行深人研究,而与技术发展紧密相关的智能传播、智慧供应链等,又在商业和产业层面,给出版业带来了诸多挑战。未来10年或者更长一些的时间,人工智能将会对中国许多行业产生冲击和影响。
本文力图从几个方面,探讨人工智能对出版业的影响。
人工智能(Artificial Intelligence),英文缩写为AI。它是计算机科学的一个分支,在计算机技术突飞猛进的今天,人工智能的研究力图探寻“智能”的实质,并生产出一种新的、能以与人类智能相似的方式做出反应的智能机器。
人工智能的方向很多,比如深度学习,迁移学习等,其中深度学习是非常重要的一个方面。它的出现在2001年,时间虽然不长,但却获得了极大的进步。
深度学习是指建立多层人工神经网络,并且训练它。一层神经网络会把大量矩阵数字作为输人,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理。
深度学习技术在技术层面的运用,为其下一代版本提供训练数据,此过程循环往复。长此以往,建立在大数据和超强计算能力之上的人工智就能形成类似人类直觉判断一样的准确性很高的判断。
1、人工智能在出版相关领域的发展
人工智能对出版业的深刻影响主要在三个方面。
1.1、语言
在人类探索人工智能的过程中,对语言的处理是一道难关。语言和创造力一样,是人类特有的、最具有人类性的特征。人类的逻辑思维以语言为形式,人类的绝大部分知识也是以语言文字的形式记载和流传下来。
让人机之间可以直接用自然语言交互,是人们长期以来所追求的。因为它既有明显的实际意义,同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机,而无须再花大量的时间和精力去学习不很自然和习惯的各种计算机语言;同时,人们可通过它进一步了解人类的语言能力和智能的机制。
简单来说,人工智能要攻克语言难关,需要实现:语音识别——让计算机听懂人说的话;语音合成——让计算机能够用人类的语言反馈;自然语言处理——让计算机能够阅读人写的文章;自然语言生成——让计算机生成文本。
实现自然语言理解和自然语言生成是十分困难的,造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性(ambiguity )。形式上一样的一段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串,并有不同的意义。为了消解歧义,是需要极其大量的知识和推理作为背景的。
而目前,语言学家和计算机专家正在做的是:将成熟的语言学知识和规则通过标注输人计算机,让它归纳出其中规律,生成统计模型。然后将消除歧义的知识加以收集和整理,用适当的形式存人计算机系统,并有效利用它们来消除歧义。
这曾经看起来是遥不可及的任务,但目前,此方面已经获得了长足的进展。
1.1.1、翻译
在全球化的今天,对于出版界来说,翻译显得尤为重要。翻译界人士估计,目前全球翻译市场的年规模达到370亿美元。《乔布斯传》和《从0到1》等新书被迅速本地化;中国文化走出去战略,也产生了大量中国图书被翻译成各种文字的需求。
美国科学家Warren Weaver 1947年提出了利用计算机进行语言自动翻译的想法。经过了几十年的努力、挫折、沉寂、复苏,自2011年开始,伴随着语音识别、机器翻译技术、DNN(深度神经网络)技术的快速发展和经济全球化的需求,翻译研究成为当今信息处理领域新的研究热点。国外,google,facebook等企业在智能翻译上已经取得了巨大进展,而中国企业科大讯飞2017年推出了全球首款实时中英互译便携式机器。
1.1.2、写作
在国内,2015年9月,腾讯财经一篇名为《8月CPI同比上涨2.0%创12月新高》的文章引起了媒体人的普遍关注,大家的关注点不在它的内容,而是其作者。这篇文章是名为Dream Writer的写稿机器人写的,它不止引用了统计局的数据,还引用了业内人士对数据的分析。
2015年至今,腾讯的写稿机器人出色完成着相关资讯整理工作。除了腾讯外,新华社的“快笔小新”、今日头条的“xiaomingbot”都是已投人应用的写稿机器人。它们在内容较为精简,数据信息为主的场景,例如体育赛事报道等场景中,已经广泛使用。
国外,美联社于2014年7月开始采用Automa tedInsights公司的Wordsmith平台自动编写企业财报,每季度可生成4000份财报,相比此前编辑们每季度的400份财报来说提升巨大。而这套人工智能系统还拥有“自主学习”功能,在三个月内自主掌握了新闻写作基本规范,错误率更低,文章质量进一步提高。
1.2、传播
根据中国互联网信息中心的数据,截至2017年6月,中国网民规模达到7.51亿人,占全球网民总数的五分之一;互联网普及率为54.3%,超过全球平均水平4.6个百分点。手机网民占比达96.3%,移动互联网主导地位强化。截至2017年6月,我国IP总量均居世界第二;中国网站数量为506万个,半年增长4.8%;国际出口带宽达到7974779Mbps,较2016年底增长20.1%。
用户的需求越来越个性化、定制化、精准化。在传统媒体时代,信息相对稀缺,并且由于技术的限制,用户只能接受统一的、标准化的信息,但是这种信息传播方式远远不能满足用户的实际需求。而在互联网时代,由于互联网技术的快速发展,互联网媒体能够利用大数据技术更好地分析用户的潜在需求,也使得用户的信息需求越来越个性化和定制化。
智能传播平台根据用户特征、场景和文章特征作个性化推荐,实现真正的千人千面,有效解决信息过载与用户个性化、定制化的信息需求之间的悖论,进而有效地沉淀用户。例如,对于公务员会推送《人民日报》和央视的信息,对于农民就多推送农业技术的相关信息;在没有Wi-Fi的环境下,多推荐耗费流量不大的图文信息,而在有Wi-Fi的环境下,则多推荐耗费流量大的音视频。用户看到的新闻和资讯,都是人工智能在大数据基础上通过深度学习判断并推送的。
1.3、供应链
对于图书出版来说,实体书的存在,决定了图书离不开纸张、印刷、生产、运输、销售的过程,供应链对于出版业来说是十分重要的。
传统供应链的发展,技术的渗透性日益增强,很多供应链已经倾向于具备或已经具备了信息化、数字化、网络化、集成化、智能化、柔性化、敏捷化、可视化、自动化等先进技术特征。供应链也经过了初级供应链、响应型供应链、柔性供应链,现在向智慧供应链发展。在初级供应链阶段,企业按照预算安排生产和交货,响应型供应链注重直接成本的同时考虑客户交互,对客户订单进行快速响应,柔性供应链是内部充分整合后的供应链,关注供应链整体成本,主张跨部门充分协同、柔性化和精益敏捷。智慧供应链在客户及供应商之间信息分享和互动协同,真正实现了通过需求感知形成需求计划。
2、人工智能对于出版的挑战以及应对之策
从上文的分析可以看出,人工智能给出版及相关行业都带来了或者说将带来巨大的影响和冲击,如何看待并应对?核心在于:突出出版的核心价值,实现跨社跨行业的联盟。
2.1、弱化编辑的语言修改职能,强化编辑的文化价值发现职能
我们看到,人工智能在语言方面通过深度学习等技术手段已经取得了长足进展,虽然现在还不能达到人工从业者的水平,但是随着技术的进步,错误率越来越小,用户的体验越来越好。这对于出版者来说是非常有价值的:
一旦机器能够较大程度上纠正作品中的语言错误,出版社应该拥抱甚至推动这个领域的人工智能,把一些文字纠错的职能交给人工智能去做,编辑进行监控和复查。大量的人力和精力就可以投人到出版的核心价值中去:发现和挖掘优秀的思想者、优秀的文化作品。挖掘优秀思想者、优秀文化作品,需要大量阅读和深厚的积累,需要价值的感受和判断,数据的收集和分析是人工智能的强项,但价值判断是人工智能无法进行的,而这,正是编辑工作无法被人工智能替代的地方。
全球文化交流更加不会受制于语言,没有了语言的掣肘,更加有利于出版社的价值发现。这就要求出版者用全球视野,用语言人工智能作为辅助工具,不仅发现中国的优秀思想者、英语世界的优秀思想者,还挖掘和发现全球其他文明中的优秀作者和作品。同时,在推动中国文化走出去的过程中,语言方面的困难和障碍也就不成问题了。
2.2、用人工智能辅助选题策划和营销传播
互联网的发展深刻改变了人们的生活方式、交流方式和阅读习惯。我们可以做出两个判断:
①信息爆炸不会停止,时间碎片化、阅读碎片化成为常态。
②大数据让人们的性格和偏好通过点击、阅读、购买等行为被清晰地刻画出来,个性化的传播和推送只会越来越精准。
出版业的传播难题在于,出版肩负着文化传播的使命,但厚重和体系化是它的特点,与互联网传播趋势不同步。如何才能利用新技术,推动行业发展?
2.2.1、利用大数据和人工智能时人们的阅读习惯进行分析,帮助进行选题策划。
我们可以从新闻界得到启发:《纽约时报》的Blossomblot可以根据社交平台的文章进行大数据分析,推测哪类型内容更具热度,辅助编辑挑选合适的素材,经过该报内部统计,经过Blossomblot筛选后的文章点击量是普通文章的38倍。
出版界也是一样。一方面,对于大众图书,大数据和人工智能帮助下的选题,在市场表现上肯定会有突出表现。在这方面,已经有一些出版社做出了尝试和探索,并取得了一些成效。例如,中国青年出版社副社长王瑞2016年底表示,该社已经通过大数据抓取开发了一些符合大众需要的选题,受到了读者的认可。另一方面,在大数据和人工智能帮助下,学术出版也能对于学术前沿有更好的把握。
2.2.2、时图书内容进行拆分,将其融入读者的碎片时间和场景中,引导读者对图书的阅读。
目前很多学习社区、学习型软件,其实就是在做这一步,其中做得优秀的比如罗辑思维等已经获得了巨大的影响力和经济回报。此类知识服务商用户意识非常强,他们提供的知识型产品,许多内容来自于图书,他们针对用户需求对图书内容作了精细的碎片化,并且用听、读、讲等多种形式呈现,从而融人了读者的碎片时间和场景,加上在微信初期积累的红利,获得了滚雪球式的发展。其提供的内容,也得到了广泛的传播,值得出版社学习和借鉴。
2.2.3、发挥编辑价值判断优势,引导优秀内容的传播
在人工智能时代,纯算法推荐容易让低俗内容、标题党和不当内容受到广泛传播。在内容接收上,基于流量和利益诱导,曲意迎合用户的算法推荐给用户的只能是越来越同质化、越来越无价值的内容,让用户陷人“信息茧房”中,日益背离技术让人获得更丰富信息的初衷。在这方面,需要编辑去引导优秀内容的传播。
2.3、利用人工智能优化供应链
传统的精益生产理论强调制造就是增值的,那是产品时代的思维,在智能供应链时代,只有客户买单的才是增值的,过量生产就是浪费。利用人工智能优化供应链,让生产制造更个性、更具弹性、响应速度更快,从生产开始,拉动物流、采购、配送等各个环节,以最终用户作为一切经营的出发点。
3、痛点的解决
出版社利用人工智能,目前面临一个最大的痛点:数据不足。
人工智能需要大量数据来不断优化调整,李开复曾表示:三个顶级专家和少量的数据,与三个二流专家和大量数据,在人工智能某方面进行竞争性研发,一定是数据多的二流专家会领先。
在实际运营中,出版社面临的困难在于:出版社无法获得大量数据。从终端看,无论是网上书店还是实体书店,都难以与出版社共享读者购买数据;从供应端看,生产厂商也不与出版方共享数据。这导致无论在生产端还是销售端,出版方都很难有足够的数据来用人工智能辅助改善决策与运营。
对于广大出版社来说,部分解决这个痛点的办法是根据特点相近、优势互补原则,结成较大联盟,开发联盟的销售平台、传播平台、生产平台,在联盟内共享数据。在生产端,通过联盟的力量,实现网络中的生产任务分配,减少排队等待等问题,缩短采购、印制等时间,提高印制效率;通过联盟的力量,和大的仓储物流商合作,减少图书流转时间。在销售端,建立联盟销售平台,增强联盟销售力量,在联盟内共享销售数据,为上游提供信息。
4、技术将推动行业格局改变
世界许多国家的出版业已经形成了寡头垄断的行业格局,例如,在法国,位于榜单前10位的出版商控制了87.5%的份额。在美国,5大社的市场份额高达80.2%。韩国营业额超过1500亿韩元的大型企业不超过9家,大都是教育出版社。在英国,5大社(不包括独立出版联盟)的市场份额达50.8%,前十大社的市场占比高达9.8%。
而中国的出版行业,在市场准人方面壁垒很高,但市场格局方面集中度却很差。
行业集中度差的结果是,出版社在微观层面竞争激烈,无法形成联盟。而通过上文关于技术和人工智能对出版业的影响我们可以看到,随着技术的进步,市场越来越需要出版商之间结成联盟关系,甚至跨行业联盟,共同打造供应链平台、传播平台、销售平台,这样才能在产业变革中适应变化,运用新技术为出版业服务。
所以,未来,无论是政府从宏观层面促进,还是出版单位基于市场压力自发行动,出版业走集团化发展道路都是可预见的趋势。而且,集团化必须是实质的而不是名义的。面临人工智能等新技术带来的社会变革,企业和行业发展比以往更需要用长远眼光从长期利益上着眼,拥抱变化,推动变革。