业内信息

人工智能与出版的未来

2018-02-09 来源:科技与出版
  【作 者】王晓光  武汉大学  信息管理学院,430072  武汉;武汉大学  信息资源研究中心,430072  武汉。

  【摘 要】出版是一项历史悠久的人类社会活动。知识则是出版与人工智能发生桥接的关键概念。网络出版和出版物的可计算性增强给人工智能的腾飞提供了加速剂,而人工智能反过来又对出版带来了潜在的革命性影响。

  【关键词】出版  人工智能  数字革命

  1、引言

  出版是一项历史悠久的人类社会活动,出版物则是人类文明的重要记录载体和传播媒介,两者形成的出版业在文化传承和科学发展过程中扮演着不可或缺的角色。作为一种知识生产和传播产业,出版业的兴起和发展离不开各种科学技术的支撑。工业时代以前,印刷作坊与图书商铺的兴起是造纸术和印刷技术普及应用的结果。工业时代,出版商社和大规模出版的产生则是高速印刷机、激光照排和计算机技术的功劳。20世纪末期,人类社会开始进人信息时代,互联网和智能移动终端的普及让数字出版快速兴起。2012以来,人工智能取得突破性发展,出版业迎来了新的发展良机。

  2、出版与人工智能的关系

  从哲学家波普尔的“三世界”理论来看,出版活动本质上是“世界三”即“客观知识世界”的构造活动。人类借助出版物的社会化生产,实现了客观物理“世界一”和主观精神“世界二”的原始记录、大规模复制和传播。在这一活动过程中,媒介技术扮演了重要的支撑角色。出版物是内容和技术的综合体,本质上都是人工产物,所以内容和技术从来都不是相对二元存在体,而是知识的不同表现形态,两者是统一的。任何形式的内容都含有技术性成分,比如内容最基本和最悠久的两种表现形式是图像和文本。从远古时期的岩画到最新的数字图像,图像的制作都依靠某种色彩或者绘画技术。文本同样如此,从最简单的书写文字到结构化电子文本,都依赖符号技术和编码技术。作为一种综合性内容表现形式的出版物更是内容与技术的紧密混合体,是人类通过创造性和历史性编辑活动实现的高级人工产物,与汽车发动机类似都凝结了人类最一般性的劳动价值和创造性知识。

  人工智能(简称AI)是研究、开发用于模拟、延伸和扩展人的智能行为(如学习、推理、思考、规划等)的一门综合性学科。现代意义上的人工智能学科诞生于1956年。20世纪七八十年代专家系统的发展代表着人工智能研究的进步。近年来,人工智能研究在大数据、机器学习、深度学习和高性能云计算平台等技术支撑下,掀起了新高潮。

  人工智能的定义相当复杂,不同的学派对人工智能的看法也有很大差别。目前,人工智能研究主要有三大学派,分别是符号主义学派、联结主义学派和行为主义学派。尽管不同学派实现人工智能的进路不同,但它们都强调机器拟人似地自主解决问题的能力,而知识是人解决问题的关键,这就意味着如果人工智能要达到拟人的效果,拥有学习、推理、思考和规划能力,就必须真正掌握并能够使用各种经验和知识。尼尔逊教授曾将人工智能定义为“关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学”。由此定义可见,人工智能与知识关系密切。

  知识正是出版与人工智能发生桥接的关键概念。众所周知,出版的对象是内容,而内容的价值所在就是其蕴含的知识。知识是人类智识增长和文化传承的基础,代表了人类的经验与发现。从知识社会学来看,信息时代以前,出版是大规模记录和传播人类知识,实现学习知识——创新知识螺旋式文明进步的最重要手段。人类的绝大多数知识都存在于纸质出版物中,然而这些出版物和内容只能由人阅读,并非给机器准备,所以学习知识和发现新知识都是由人这种智能体完成的。近些年来,随着文化资源数字化的进展,越来越多的古籍、绘本、照片、图书等出版物和文献资源被数字化,成为计算机可以读取的数字对象和大数据资源。在机器学习算法支撑下,这些大数据形式的知识资源正在成为人工智能程序的基础“食材”。人工智能系统正是在这些已有的“出版内容资源”基础上一步步发展训练成熟,进而具有了发现新知识的可能。所以,从某种程度上说,人类上千年的出版活动一直在客观上为人工智能的发展和知识发现的自动化积累条件和准备资源。

  随着互联网的普及与发展,越来越多的内容正在以天生数字化的形式被生产和传播,人类社会正在加速进人数字时代。在专业与学术出版领域,科学知识的语义化、网络化、模块化特征尤其显著。伴随着语义出版的兴起,人类知识的编码化程度越来越高,越来越利于人工智能的学习和理解,可以说网络出版和出版物的可计算性增强给人工智能的腾飞提供了加速剂。

  3、人工智能对出版各环节的潜在影响

  人工智能的具体研究内容很多,包括复杂问题求解、自然语言理解、自动程序设计、专家系统、机器学习、智能检索、人工生命、群体智能等。目前,大数据驱动的知识学习、机器视觉理解、跨媒体协同处理、知识计算等是人工智能领域的发展热点。这些技术因其追求对数字内容的智能化理解、处理和操作而与出版关系密切,而且对出版多个环节都有潜在重大影响。

  3.1、对内容创作的影响

  内容创作是出版活动的原点。叙事长久以来被认为是人的独有活动,所以传统的出版物叙事性内容创作都是由作家、专家学者或者记者等专业人士操刀完成。计算机仅仅作为写作工具辅助作者进行记录工作。近年来,人工智能进步迅速,借助机器学习、表示学习、深度学习、自然语言处理、文本生成等各种新兴算法和大数据理解技术,不仅可以将语音实时正确地转录成文字实现速记和录人,辅助作者写作,还能通过神经网络学习掌握人类的财经新闻、体育新闻、法律文书等规则文本的写作规则与技巧,进而自主写出高水平新闻报道。腾讯公司、新华网等机构都已经借助人工智能技术写出和发布了海量的新闻文章。在修辞、剧情和结构复杂的小说和诗词等高级文本创作上,人工智能也是进步神速。微软亚洲研究院开发的多个诗词创作机器人,为文学文本的创作积累了丰富的经验。在科学论文写作上,人工智能可以根据上下文进行引文推荐、观点提示,甚至可以自动创作文献综述。计算机创作的学术论文也早已骗过审稿人,被正规学术期刊接受。

  人工智能不仅能够写作原本千人一面性的内容,还能够根据个人偏好实时生产个性化内容。随着大数据分析技术的进步,人工智能可以借助人类的行为数据理解整个人类的行事规则、文化习惯以及社会趋势,实现自动化选题和个性化实时创作。想象一下小说和游戏的差别。对于小说来说,不同的读者看到的内容是一致的,结尾也是一致的。在网络游戏里面,虽然不同的人会有不同的体验,但游戏依旧是提前设计好的。未来,人工智能将可能开启全新的内容消费时代,根据个人偏好,人工智能可以实时创作体验者喜欢的小说内容或者游戏内容。

  3.2、对内容编辑的影响

  出版物的编辑活动包括信息采集、鉴审、选择、编序、组织等环节[。人工智能在所有这些环节都大有用武之地,它不仅可以根据主题自动从互联网采集内容,还能自动进行鉴定审核,剔除不可信内容,选择合适的条目,进行自动逻辑化编序和个性化组织。此外,人工智能不仅可以实现低档次的词汇拼写自动修正,还能根据上下文自动调整修辞技巧,消除冗余、反复、歧义等语病。

  除了处理单模态的文本外,人工智能还将打破多媒体信息之间的界限,实现多媒体信息的跨模态处理,例如在理解图像和文本深度语义的基础上,实现图文互现,自动为一段文字配图,自动为一张图像生成描述性文本。这些看起来不可能实现的任务,已经在ImageNet相关研究基础上取得了阶段性成果叫。2017年美国计算机学会会刊(TOMM)最佳论文奖授予了微软亚洲研究院的一篇关于图文排版自动生成算法研究的文章。在该文章中,作者创造性地提出了一种可计算的自动排版框架原型,该原型通过对以下关键问题的优化,如视觉空间的配重、心理学中的色彩和谐因子等把视觉呈现、文字语义、设计原则等领域专家的先验知识集成到了一个多媒体计算框架之内,实现了视觉文本版面自动设计。可以想象,随着跨信息智能处理技术的突破,人工智能将打破不同媒体之间的差别,在大数据和深度学习双重驱动下实现跨媒体语义理解和多媒体内容精细编辑。

  3.3、对内容发行传播的影响

  人工智能对内容发行和传播方面的影响也将是不可估量的。借助用户行为大数据实时分析,人工智能将对用户进行精准的和实时的画像,并在此基础上理解用户的信息需求,进而准确推送所需知识和信息内容,实现内容精准发行和阅读服务。目前,部分新闻客户端已经初步实现了个性化内容推送与服务,如今日头条。除此之外,人工智能也能根据用户行为信息,进一步优化计算广告的精准度和效力,进一步改进内容在社交媒体上的分发效率,实现传播效果的最大化。美国的一些新兴社交媒体内容生产机构就在利用人工智能算法实时监测短视频的传播路径,进而实时调整传播策略以及内容生产策略,形成了从传播监控到内容生产的闭环。

  当然,从人工智能的潜能来看,其对出版活动的影响不仅仅停留在以上三个方面。人工智能不仅能拟人似地创作、编辑、分发内容,还能监控整个社会的信息生产、流通与消费态势,为出版产业管理、文化思潮和意识形态监控提供决策支持服务。

  回到本文的起点,出版作为一个历史性概念,如果其内涵随着社会进步而不断扩展演化的话,随着人工智能、物联网、区块链等技术融人,出版业可能会拥有更大的变化潜力。例如,人工智能+物联网可以实时采集、集成、融合、分析、挖掘、整理多源数据,并在此基础上进行叙事性内容生产,所有环节都可以无人干预,真正进人全自动的编辑和发布时代。另外,目前正在快速发展的知识图谱技术正在推动专业出版商的业务向知识服务商转型。可以大但预测,未来学术论文的获取可能是完全开放的,而高级知识服务才是收费的,甚至是昂贵的。在人工智能系统支撑下,人类获取知识的主流方式将是对话式的。此时,何为出版,何为媒介?

  4、结语

  一切正如数字时代的预言者——尼葛洛庞帝所说“从原子到比特的飞跃已经势不可挡、无法逆转”。社会是一个复杂巨系统,而技术是社会发展的内生性资源要素。本文初步对出版领域未来应用人工智能技术进行了展望,这种散点式的预测并不能保证预测的可靠性。事实上,重大的技术革命对社会的影响往往超乎人类想象,对社会结构和行业生态的影响也是颠覆性的,只有这样才符合技术革命的历史使命。由此来看,人工智能作为一种颠覆性技术体系对出版业的影响是难于预估的。蛋壳从外部打破只有被吃掉,从内部打破则可能孵化出凤凰。面对这样一种革命性技术,出版人必须采取更加开放的态度,紧跟时代发展潮流,积极采纳和创新应用,完成时代赋予的社会责任。


















国家新闻出版广电总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省新闻出版广电局 | 湖北省邮政公司 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江出版传媒集团有限公司 | 武汉市文化新闻出版广电局 | 长江日报报业集团 | 知音传媒集团 | 中国移动湖北分公司 | 中国电信湖北分公司 | 中国联通湖北分公司 | 湖北省期刊协会 | 湖北省出版物发行行业会 | 湖北中图长江文化传媒有限公司 | 中国期刊协会期刊民营发行(营销)分会 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持