业内信息

人工智能翻译的数字化创新与实践应用研究——以咪咕灵犀AI应用为例

2020-04-19 来源:《出版广角》
  【作 者】孙荧:西北工业大学

  【摘 要】作为机器翻译和语音交互技术领跑者,人工智能翻译应用咪咕灵犀借助AI,提升实时翻译、场景服务等功能设置,不断推动产品迭代,为用户提供贴心服务。咪咕灵犀为人工智能在语言服务业的应用,既提供创新理论又促进实践应用。未来,我国数字出版业要以此为契机,不断加强技术研发创新,探索多样化衍生发展,突出行业和用户需求分析,为“人工智能+互联网”服务产业的发展注入不竭动力。

  【关键词】人工智能;数字化;咪咕灵犀;翻译;语言服务;应用

  随着知识与技术创新的深入融合,人工智能语言服务业市场持续升温。据美国语言行业调查机构CSA预测,到2020年,全球语言服务行业市场总规模增长率为9.41%,市场份额将达到460亿美元。大数据、云计算与人工智能的整合,在催生新业态、新成果的同时,也拓展了AI+语言服务水平,提升了语言服务质量,助推我国文化产业和贸易投资迈向高水平。作为机器翻译和语音交互技术的领跑者,咪咕数媒人工智能翻译应用咪咕灵犀在语言服务市场保持强劲增长势头,为我国人工智能与语言服务的有效融合发展提供了可资借鉴的经验与启示。

  一、人工智能与语言服务结合的必要性和可行性

  人工智能翻译对语言服务业有推动作用,最直接的体现在提高翻译效率,节省人力资本,完善行业结构,二者结合具有必要性和可行性。

  1.人工智能与语言服务结合的必要性

  一是改变思维观念与方式。人工智能与语言服务结合,促进人类思维观念发展。人工智能系统语言知识库具有自我学习和持续更新能力,不间断地进行系统维护与更新。尤其是人工智能具备语言交际行为的多样化特质,使其可以有效地提升机器翻译准确度。二是变革社会结构。从某种程度上讲,人工智能与语言服务结合让智能机器成为人类劳动的替代物,促进社会进入机器“三元型”结构。未来,只有更好地学会与机器相处,人类才能更好地适应变化的社会结构。三是促进经济发展。人工智能与语言服务结合能最大限度替代人工,为人类创造经济效益和社会价值。人工智能背后隐含着专家系统,该系统是智能化计算机程序系统,能够模拟专家决策过程,更好地解决专家级别的语言交际问题。

  2.人工智能与语言服务结合的可行性

  一方面,人工智能领域的自然语言处理技术日臻成熟。自然语言处理(NLP)是人工智能应用领域的重要指标。它通过对人类写作与说话方式的模仿,理解并解释人类行为,弥补人类语言交流的漏洞,实现像人类一样的语言智能交流。自然语言处理涉及机器翻译和语音识别技术,包括自然语言理解和自然语言生成两个阶段。其中,自然语言理解(NLU)技术已经取得突破,人工智能翻译机器能够较为准确地理解给定文本的基本含义,有效排除词法、句法、语义、回指的歧义性;自然语言生成(NLG)技术通过结构化数据实现可读式自动文本生成,其中的文本规划、语句规划与语法实现已经具备了流畅进行的可能。可以说,人工智能自然语言处理技术已经较为成熟,人工智能与语言结合变得更为可行。另一方面,作为思维性极强的活动形式,语言表达与个人所处环境、知识背景是紧密相关的。目前,机器翻译与人工智能尚不能针对每一种表达给出恰如其分的翻译。例如,在我国外宣翻译过程中,对于汉语中某些“好”“较好”“较多”“很多”等模糊表述,除非进行数据量化,否则人工智能无法准确表达。此外,由于地域、行业以及翻译任务难度不同,翻译质量和数量有不同的专业性要求。从目前状况来说,人工智能取代人工翻译仅能取代其中一部分,人工智能若要达到并超过人工翻译水平,还有很长的路要走。

  二、咪咕数媒AI的创新

  咪咕数媒的创新实践效果是显著的,既产生了良好的社会效益,也为跨越发展奠定了基础,收到了较好的经济效益。

  1.打造出版领域行业标准

  作为中国移动旗下专注全媒体出版、智能语音与有声数字阅读的互联网公司,咪咕数媒成立于2014年。2016年,咪咕数媒就推出全媒出版概念,创造了“纸质、电子、有声、视频、衍生”五位一体的全媒出版新模式,咪咕数媒价值达到68亿元。同时,咪咕数媒强化与央广视讯、中国出版协会等的合作关系,突出数字AI研发管理正规化、数字化发展。2017年8月,作为全国首批20家出版融合发展重点实验室之一的咪咕数媒实验室揭牌创建,在人工智能、行业架构、大数据分析方面进行技术研发,打造出版领域行业标准建设及产业人才孵化平台。2018年11月,咪咕灵犀莫比斯AI智能翻译耳机荣获“CES2019创新产品奖”,展示了中国智能硬件强劲实力,在业界掀起科技改变生活的讨论热潮。

  2.重视多元化跨界发展

  作为中国移动咪咕公司的战略性产品,咪咕灵犀早在2016年就开启智能语音的发展布局。当前,咪咕灵犀的语音速记、个性提醒、六国翻译等功能已经得到用户的普遍认可,语音包、定制内容也具备市场规模,智能语音硬件市场的开拓也满足不同用户的个性化需求,用户体验、经济效益日益凸显。同时,咪咕数媒重视多元化跨界发展的路径,借助旗下的咪咕动漫等聚集动漫IP,布局二次元人工智能,上线虚拟偶像语音包,调动二次元用户积极性。咪咕灵犀还打造原创夜读栏目“灵犀电台”,上线不到两个月,注册用户就突破100万名,多名声优加入主播阵营,让咪咕电台的互联网效应得到进一步提升,真正打通“原创平台+IP运营+影视+游戏+动漫”的垂直内部生态体系,为产品的多样化运作开启全新可能。

  三、咪咕灵犀AI技术的实践应用

  咪咕灵犀AI创新实践集中体现在创新阅读生产方式,探索高效内容产出,强化产品迭代和纸数融合衍生效应等领域。

  1.探索高效内容产出

  作为智能语言翻译工具,咪咕灵犀采用NMT翻译框架,整合注意力和循环神经网络。在翻译功能上,咪咕灵犀支持实时翻译、对话翻译、文本翻译、图像翻译。在翻译功能的延展领域,咪咕灵犀聚焦出国旅游常用场景,提供实用口语表达,开发出语音速记、语音提醒等功能,上线英文有声内容,提供趣味英语环境。通过用户分析和智能推荐,咪咕灵犀解决用户画像、内容匹配问题,实现智能推荐。咪咕灵犀还通过语音交互、个性定制、生动演绎等人工智能手段,改变信息获取方式,使得翻译更准确、更及时、更先进。

  在人工智能内容创作上,咪咕灵犀与科大讯飞联合研发,强化了人工代替、即见即听、机器创作三大基本路向,实现了人工智能大数据运算的实践落地。一方面,咪咕灵犀突出机器翻译功能。咪咕灵犀机器翻译体现了规则、统计、神经网络三位一体的翻译规则,既突出词语规则的标准性特质,也体现语料库自动翻译实践的可行性,实现神经网络化完善路径,使翻译结果正确性与可读性有较大提升。在翻译过程中,对于某一个特定词语的理解,咪咕灵犀都与当前语境进行深度融合分析,通过上下文语义联系,给出合情合理的翻译结果。另一方面,咪咕灵犀利用语音识别的基本技术,考虑翻译的灵活性、碎片化与临时性特质,将语言识别技术与语音符号处理、机器自动识别、信息模式识别等技术有机融合,构成模式化的识别系统。咪咕灵犀能够借助神经网络学习语音,与模型库进行自动对照匹配,提高内容的准确度。在具体的场景中,咪咕灵犀借助先进的语音识别功能,实现实时语音转文字、实时对照词库、实时编辑上屏等,有效解决了内容写作与管理的诸多问题,极大提升了创作效率。

  2.强化产品的迭代化发展

  咪咕灵犀充分认识产品为王、版本迭代的重要性,提出数字内容采集、产品快速迭代的发展方式。2012年12月,咪咕灵犀推出1.0版本产品,取名为“灵犀语音助手”。该产品基于云端架构,打造语言操控和聊天服务一体平台,得到用户的普遍认可。2013年7月,咪咕灵犀2.0版本产品亮相,该产品强化实时通话、短信提醒等操控需求,搭建产品信源优化管理平台,更加突出互联网信息服务的产品设定。2014年8月,咪咕灵犀推出3.0版本产品,该产品完善了内容功能,提升了信息获取效率,探索了垂直测试、流量分发等智能化技术。2015年1月,咪咕灵犀推出3.1版本产品,为产品内容进一步扩容,不断缩短信息获取路径,强化用户个性化定制需求满足。2016年7月,咪咕灵犀推出4.0版本产品,强化服务的分类和语音的有效融合。2017年4月,咪咕灵犀推出5.0版本产品,突出语音速记、翻译、提醒三个助手属性功能,不断优化生活类服务设置,增加咨询收听功能和听书智能推送,灵犀品牌得到全面升级。2018年5月,咪咕灵犀推出6.0版本产品,强化基于AIUI引擎的深度智能操控,实现咪咕灵犀智能化全面提升,让灵犀理解力和记忆功能充分发挥,促进多轮场景化对话的进程。快速迭代的产品设置,不仅符合互联网时代产品研发的特质,也顺应面向用户的营销本质。

  3.实施纸数融合衍生运营

  咪咕灵犀建立人工智能翻译资产管理平台,采用DRM、网络搜索、网络识别等技术,对人工智能翻译使用、管理、跟踪与检索进行一体化运营。其技术上采用互联网、移动端等多样化的方式,确保为数字人工智能翻译的生产、加工、存储、发布与使用提供全方位、多角度的技术支撑与保护。以此为基石,咪咕灵犀为中国移动等诸多AI研发管理机构,提供人工智能翻译追踪与管理体系。2018年11月,《半月谈》与咪咕数媒签署“纸数融媒大联动”协议,开展优质内容、多元渠道合作,为用户带来权威资讯、用户互动及沉浸体验,以纸媒带动数媒,以数媒整合纸媒,放大纸数融合衍生效应。

  四、咪咕灵犀AI实践应用的启示

  咪咕灵犀AI实践表明,数字出版要加强技术研发创新,必须探索多样化衍生发展,突出行业和用户需求,为人工智能与语言服务的融合注入不竭动力。

  1.完善AI翻译技术研发创新

  完善“人工智能+翻译”技术研发管理。“人工智能+翻译”可借鉴咪咕灵犀的技术发展模式,不断优化人工智能企业、翻译协会与市场方面的沟通,促进人工智能翻译应用数字标准的制定与完善,并将这一标准及时反馈到翻译行业和市场中去,为数字出版提供更好的人工智能翻译服务。同时,“人工智能+翻译”要发挥人工智能技术优势,探索促进人工智能翻译技术发展的举措,营造良性的创新发展环境,尤其是面对国际竞争时,要引导并推动争端得到有效化解,为作品的搜寻与应用提供便利。此外,相关企业要通过完善数字产品授权激励机制,为数字化商品的评议、购买、使用等提供相应的激励措施,确保数字产品得到系统化提升。

  2.探索多样化衍生发展

  无论是单纯的人工智能技术,还是AI翻译语言融合创新,都是数字产业衍生发展的支撑。咪咕数媒在数字产业领域的尝试启示我们,多元化路径能够有效规避风险,激活融合发展路径优势。咪咕数媒在多元化发展中衍生出全媒出版形态,既有咪咕阅读平台汇集多语种、多场景内容及语音服务,也有咪咕学堂覆盖从幼儿到职场的课程设置,还有全IP的游戏衍生开发与场景联动。此外,咪咕数媒还打造面向政府以及企业的数字图书馆,面向高校大学生的理想之光APP,以及推出面向社会的咪咕中信书店APP、咪咕Kindle电子阅读器等。上述多元化的发展为咪咕灵犀的研发与提升积累了经验。其实,咪咕灵犀本身就是强强联合的产物。“中国移动+咪咕数媒+科大讯飞”的组合,既有用户数据,也有技术支持,还有运营布局能力和智能硬件产品推广经验,从而产生了较强的规模效应和覆盖效应,这对咪咕灵犀的迭代升级与市场提升具有支撑作用。

  3.突出行业和用户需求分析

  一方面,相关企业要强化人工智能语言服务市场分析。人工智能与语言服务融合一直处于领跑者的位置,市场需求量大,资本关注度高,行业发展迅猛。尽管技术研发和实践应用都处于摸索阶段,但BAT、科大讯飞等行业巨头纷纷布局,抢占人工智能、语音助手、智能硬件的行业制高点。可见,人工智能相关产业的研发,必须强化市场分析力度,加大市场调研层次和投入,确保不被技术和行业发展所抛弃。另一方面,相关企业要注重人工智能翻译技术的用户分析。用户是产品的上帝,只有紧跟用户需求变化进行产品迭代,才能不被时代淘汰。为此,人工智能语言服务的发展要借助大数据、云计算等数字技术,加大用户群体消费习惯、使用体验的收集和分析,对用户进行画像,准确把握目标用户的内在需求,确定人工智能语言服务融合的主要用户类别。如咪咕灵犀主要针对单纯的手机依赖人群、传统的商务人士等用户,据此确定产品用户特征;针对人工智能中语音助手的入口,让更为便捷的技术得到最宽泛年龄层的使用和认可。

  人工智能翻译对语言服务业有推动作用,二者结合具有必要性和可行性。咪咕灵犀AI创新作为上述实践的集中体现,通过探索高效内容产出,强化产品迭代化发展,促进纸数融合发展,抢占了行业领先位置。未来,我国数字出版业要以此为契机,不断加强技术研发创新,探索多样化衍生发展,突出行业和用户需求分析,为“人工智能+互联网”服务产业的发展注入不竭动力。

  参考文献

  [1]王婉琦.人工智能在语言服务业中的应用现状与前景研究[J].南方论坛,2018(5):22-23.

  [2]赵舒.人工智能时代大学通识写作教学的困境与突破[J].科教导刊,2018(27):61-62.

  [3]杨阳.人工智能时代下外语教师面临的挑战和机遇[J].智库时代,2018(27):241-242.

  [4]王琳琳.人工智能背景下翻译教学语料库建设[J].中华辞赋,2018(7):120.

  [5]高革飞,张军.浅谈人工智能发展及其对翻译的影响[J].海外英语,2018(20):18-19.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号