业内信息

出版嫁接AI技术样本观察

2018-09-19 来源:中国出版传媒商报
  关键词 智能机器人 深度标引 语音交互 图像识别
 
  个案一 百科全书搭载人工智能新姿态
 
  2017年10月,中国大百科全书出版社启动了百科全书与人工智能应用的研发项目。2018年8月,正式发布了第一代百科智能机器人“司南君”。“司南君”的诞生也是大百科社对于人工智能在出版业应用探索的重要节点。
 
  中国大百科全书出版社新媒体中心主任张新智表示,基于与中国科学院此前在科研领域的合作基础,决定立项研发机器人后,大百科社调研了很多机构,最终选定与中国科学院自动化研究所的机器人实验室合作。双方共同设计方案,共同研发。大百科社负责外观设计、功能设计、标准制定、底层数据编辑加工、数据整理和标引、联合测试、服务器搭建、数据管理等工作。作为重大创新项目,在社领导统一指挥下,承担具体工作的新媒体中心成立了专门的项目研发小组。
 
  从初步设计到第一台成品正式亮相,该机器人的研发历时10个月。据张新智介绍,“司南君”的外形设计环节反复修改了20多稿,才确定融合“孔子和指南针”元素这一方案。另外,百科机器人存储了来自《中国大百科全书》的权威内容数据资源,在数据整理和标引环节方面,也是经历了较长时间的打磨和严格的反复试验,对庞大语料库的深度标引也成为其主要特色之一。他提到,内容建设和软件建设以及两者的结合部分,是这一项目的难点所在。经过大百科社和自动化所的共同攻关,这一难点被突破,实现了精准百科内容与人工智能的巧妙结合。
 
  百科机器人“司南君”是国内首台装载有来源于《中国大百科全书》内容的机器人,这些内容都是专家撰写、编辑加工,并精细标引过的。内容准确、“思想端正”。同时,“司南君”使用的自动化所定制研发的全语音操作系统、超脑智能系统以及综合算法系统,其中的降噪处理技术处于行业领先水平。除此之外,大百科社还正在为“司南君”兼具文化内涵又不失现代感的外观申请外观设计专利。
 
  张新智表示,大百科社迈出研发机器人这一步,是着眼于未来百科全书的发展与应用和国家级知识服务平台建设的积极探索。希望这种探索能够成为出版业的一个融合发展案例,为行业发展提供有益经验。他还透露,大百科社下一步探索的重点将聚集在人工智能技术对于多媒体内容的快速聚集与关联、质量控制与自我完善、知识体系构建与扩展、内容传播的影响与促进、内容的精准识别与输出等方面。
 
  出版社涉足人工智能产品开发,应该立足于自身优势,做好定位,找好切入点,并解决好资金、技术、内容、人才等多方面的问题。张新智认为,出版同行涉足人工智能产品开发是一种可喜现象。不过,目前大多处于相关互联网技术公司研发和运营、出版社只提供部分内容授权的阶段。这类机器人功能较为单一,更偏重于语音交互。而且内容质量参差不齐,甚至有大量谬误,已经引起了相关管理部门的注意。下一步的发展,出版机构要更注重内容质量的提升以及真正的人工智能技术的使用。
 
  个案二 三渠道年销慧读版机器人近10万台
 
  从2016年开始,北方妇女儿童出版社就与人工智能软硬件开发商北京智能管家科技有限公司进行合作,这种合作不只局限于内容的授权,而在于全流程的参与,包括设计内容开发、慧读版机器人设计及销售。在具体合作时会有所分工,北京智能管家科技有限公司主要负责机器人硬件端的设计、生产,通过机器人的语音和图像识功能把出版社产出的图书内容生动化。在内容的选择上,据北方妇女儿童出版社有限责任公司总编辑师晓晖介绍,该社在原有少儿读物内容的基础上,将内容进行碎片化管理,打破原有图书的体例,重新按照内容分类和年龄进行组合;适当改变原有图书语言,转化为更口语化的问答和互动。智能机器人的内容设定由出版社整体规划设计,内容适合各个年龄段的孩子,实现寓教于乐的教育功能。
 
  在使用机器人之前,出版社会将专家对内容教授的指导意见传达给家长,让家长有的放矢。机器人可以发出真人阅读的声音,能够识读绘本。通过孩子与机器人的交互,随着时间的积累,机器人可以勾勒出用户画像,对孩子的语言、健康、科学、社会、艺术等方面能力综合评价,通过大数据帮助家长对孩子成长情况数字化。据悉,慧读版机器人的销售主要有三种渠道,一是传统3C数码店,目前全国有近2000个终端店在销售;二是互联网销售渠道(各电商及微商);三是传统的新华书店渠道。由于刚进入市场,出版社有意通过控制研发价格以便快速打开市场,仅1年多,慧读版机器人已经销售近10万台。接下来,北方少年儿童出版社仍会继续考虑如何降低整体研发成本,让机器人走入更多家庭。
 
  个案三 人工智能让“绘声绘色”轻而易举
 
  随着新媒体的迅速发展,传统纸质出版与新技术的融合脚步会加大加快。从刚开始的成品图书数字开发,逐渐发展成双方共同策划、开发内容选题,纸质与数字媒体互相借力,互相促进,是大趋势。越来越多的听书、看书平台上线,尤其是童书板块,各平台都在争取更好的内容。目前,浙江少年儿童出版社正与包括咔哒故事、网易有道乐读在内的不少平台开展合作,推出了一些童书类作品。浙少社也是南京阿凡达机器人科技有限公司最早接触的出版社之一,后期会有儿童故事类、科学类、幼儿期刊类的内容进行数字化开发,通过智能机器人丰富优质内容的输出形式。
 
  浙少社在童书与人工智能结合方面做了不少尝试和探索,法国绘本故事“绘声绘色”系列便是其中的代表。“绘声绘色”系列是浙少社、法国Bayard出版集团以及阿里巴巴AI智能团队三方合作的产物。Bayard出版集团旗下有一份面向3——6岁幼儿的故事类期刊TRALALIRE,每期有一个绘本故事,浙少社旗下故事类期刊《幼儿故事大王》也正好是面向这个年龄段。于是从2010年开始,浙少社引进Bayard的绘本故事,每月进行刊登。几年来,累积了大量优质绘本故事,配套的期刊栏目、游戏都已经相对成熟。但是由于这些年国内引进版绘本的市场呈爆炸式增长,浙少社一直在寻找一个亮点让它们脱颖而出,这也是这些内容一直未用图书的形式呈现的原因,直到遇到了阿里AI。2017年7月,阿里巴巴人工智能实验室发布了第一款AI智能产品“天猫精灵”,上线第一天销量即突破百万。2018年3月,阿里巴巴发布了AliGenie人工智能系统2.0版,在原有的语音交互能力基础上,新增了图像识别能力,也就是“天猫精灵火眼”的功能,它能够通过扫描图像,识别图书封面,然后为孩子阅读图书。
 
  浙少社、法国Bayard出版集团以及阿里巴巴AI智能团队三方迅速就合作达成一致,浙少社婴童分社编辑团队负责内容的把关和书稿的制作,阿里团队负责AI相关的图书识别技术与音频开发。从今年4月初策划到6月初正式面市,“绘声绘色”系列的策划出版仅用时2个月,目的就是为了以最快的速度,作为配套图书配合“天猫精灵”儿童智能音箱的发售。当然,这样的出书速度离不开此前期刊对该套书核心内容——绘本故事打下的良好基础。
 
  浙少社国际事业部朱静表示,当时面临的最大的问题在于要把内容进行重新的编辑加工,使它更好地配合“天猫精灵”的技术和用户的需求。为此,针对天猫精灵儿童智能音箱的主要用户群——年轻妈妈的需要,浙少社从80多个绘本故事里精选出12个绘本故事,并为它们分别设置了不同的主题,比如社会交往、认知世界、情绪情感等等。这些绘本的作者均为世界优秀绘本作家、插画家,曾入选意大利博洛尼亚插图展、捷克布拉迪斯国际插画双年评审团大奖、法国电视台“儿童图画书奖”、美国纽约时报十佳图书等。
 
  为了让家长进行更有效的亲子阅读,浙少社邀请幼教专家为每个故事进行导读,制作了独立的指导手册。同时,配合“天猫精灵”的语音交互技术,根据故事主题设置了针对不同年龄段的以问答为主要形式的亲子互动和游戏板块。朱静透露,“绘声绘色”是浙少社第一次与阿里团队合作,打下了良好的基础,后期双方会有更广泛、深入的合作。不过,在朱静看来,如何利用新技术,提高儿童的阅读兴趣,用新技术引导孩子们爱上读书,是目的所在。而版权是多媒体阅读产品的开发过程中的基础性问题之一,出版社在这方面一定要把好关。(记者 张聪聪 李丽萍)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号