业内信息

“SMPIC”模型: 重塑5G时代智能化数字出版流程

2020-04-12 来源: 《中国出版》
  【作 者】郭璐、王懂、周荣庭:中国科学技术大学科技传播与科技政策系;合肥师范学院文学院

  【摘 要】随着5G技术走向应用和人工智能技术的深入,两者的结合将重塑数字出版流程。文章从5G、人工智能和数字出版三者形成的关系入手,以感知、挖掘、预测、推断、创作五大算法模块为基础构建了“SMPIC”功能模型,以描绘数字出版中人工智能算法的应用模式,并定义了数字出版流。在5G技术驱动下,数字出版流程将遵循人工智能算法的逻辑重新构建,并呈现出全新特征,进而构筑数字出版的未来图景。

  【关键词】5G;数字出版;人工智能;SMPIC

  数字出版(digital publishing)是指信息以二进制代码形式存储于介质中,信息的处理与传递必须借助计算机或类似设备来进行的一种出版形式。 [1]数字出版的触角已遍及整个信息通信领域,涌现出了丰富的创新应用,但目前仍受到网络传输和运算能力的限制,无法达到生产效能的最大化。在5G技术环境下,伴随着人工智能赋能,数字出版行业在演进中正在发生着深刻变革。

  一、5G助力智能化数字出版

  智能化数字出版的进程将立足于高速传输的5G技术和人工智能(AI)技术。将人工智能技术用于5G网络,构建自主思考的系统对5G网络意义重大,人工智能将赋予5G网络处理复杂问题和应对风险的能力,以构建更加强健的传输系统。同时,5G的技术氛围将渗透社会方方面面,将助力人工智能的大规模应用。

  5G与AI两者之间是“共生”关系。“共生”是由德国微生物学家德贝里(Antonde Bary)提出的一种生物现象,意指不同生物密切生活在一起,达到互补协作与共享的和谐局面。[2]这里的“共生”代表两层含义,在任意一个时间截面上,5G和AI是静态的互补、协作、共享关系,而在纵向的动态发展中,二者相互促进、协同演化。

  共生关系下的5G和人工智能技术将联合重塑数字出版。其中,5G作为信息传输通道,由运营商提供。而人工智能则需要出版机构自身去思考运用。两者对数字出版的影响,核心在AI层面。目前,数字出版与AI技术的结合,集中体现在生产流程中嵌入AI算法,但这种嵌入式的运用是单点、碎片式的,缺乏更加灵活和系统化的融合模式。

  为了更加高效地应对面向未来的数字出版场景,人工智能算法将从作为附加模块的简单嵌入过渡到对数字出版流程的全面渗透。本文探讨的数字出版主要指由机构主导实施,以选题策划、内容生产、编辑审校、发行推送和反馈互动五个主要环节构成。流程中各环节在智能化过程中,将遵循人工智能算法的基本逻辑重新构建。

  针对人工智能在5G网络中可以解决的典型问题,可归并为四类典型的AI算法模块,它们分别是感知(sensing)、挖掘(mining)、预测 (prediction)、推理(reasoning),[3][4]各模块包含了从支持向量机、神经网络到强化学习的一系列算法集合。上述四个模块从业务预测、资源分配等领域构建针对未来各类型应用的技术支持,而数字出版就是其中的典型应用。

  数字出版的各环节需要上述四种模块的一个或多个作为支持。但针对数字出版具体情况也需做适当调整。推理模块作为智能5G技术的下游环节,主要进行流量分配和决策分发,而这与数字出版场景并不完全匹配。因此本文以推断(inferring)模块作为替代。而针对数字出版的内容生产环节,上述四个模块的功能均难以匹配其要求,因而本文加入了创作(creating)模块,从而建构出5G环境下智能化数字出版流程的功能模型,即以感知(sensing)、挖掘(mining)、预测(predicting)、推断(inferring)和创作(creating)五大模块为基础的“SMPIC”模型(见图1)。



图1 “SMPIC”模型

  “SMPIC”模型的总体流程是按照感知、挖掘、预测到推断模块递进,各模块可支持若干个数字出版环节,且功能相对独立。其中,感知、挖掘、推断三大模块贯穿数字出版全流程。现有技术条件下,预测模块对应选题策划、内容生产、发行推送环节。创作模块则隶属于推断模块,目前仅服务于内容生产环节。

  面对现实中丰富的数字出版样式,诸如用户生产内容(UGC)、众筹出版等,数字出版流程在总体遵循模型各模块层层递进的基础上,也可根据实际情况做出部分模块的组合、并行和单独运用。例如,区别于机构主导,UGC是一种常见的用户主导的内容生产模式,用户发布评论、改编内容等过程,主要借助创作算法模块实现。“SMPIC”模型的运用虽具有一定的灵活性,但从论述的系统性考虑,下文遵循模型总体进程展开。

  二、“SMPIC”算法模块在数字出版的应用

  面向5G环境下的数字出版场景,“SMPIC”模型将遵循人工智能算法的逻辑,以感知、挖掘、预测、推断、创作五大算法模块为基础,更加系统和灵活地融入数字出版各环节,实现多元感知、深度挖掘、精准预测、高效决策和生产,进而推动数字出版流程的智能化重塑。

  1.感知:探测与采集数字出版流

  5G环境中高速、异质化的数字内容需要用更加智能化的方式去搜集。首先需要运用的是人工智能感知算法模块。感知模块有什么作用呢?人工智能作为具备感知能力的主体,能监测数字出版所处的网络信息环境,并对特定内容进行探测。[5]感知模块就是负责监测外部环境中和各环节自身所产生的数据,并随时对后续模块产生影响。

  在5G与人工智能环境下,特定的数字化内容转变为数字出版流(digital publishing flow),数字出版流是异质动态的数字内容,包含一段完整、连续的数字内容。数字出版流是高度异质的。例如网络环境中的虚拟现实(VR)视频,用户对其评论的内容可能包含多种媒介形态,这一段数据结构就包括该段VR视频和评论,评论可以是图文、语音和视频等。这一整套数据结构就是高度异质化的一段数字出版流。数字出版流是动态的,动态性来源于内容本身的快速变更,也来源于用户对它的交互过程。

  立足当下的数字出版实践,人工智能作为智能主体,捕捉所处环境中异质的数字出版流,对数字出版的全流程实施监控,包括抽取关键信息、捕捉流变的话题、舆情,采集用户(公众、机构)的订阅、点击、关注等行为数据,探知热门题材,识别潜在创作者等。算法可以审核特定内容,优兔(YouTube)于2017年宣布加强人工智能审查,以提升不良内容识别率,加强视频的内容监管,譬如审查虚假、消极信息。[6]在反馈互动环节中,感知算法抓取用户反馈数据,适时调整策略。

  面向5G时代数字出版的感知场景,人工智能采集的数据将从传统的图文声像数据转变为混杂全息、虚拟现实等高通量、高复杂度、高运算速度、高异质化的新型数字结构。对数字出版流的感知也从基于经验的、低效的、人工采集的归纳、推理、决策等过程过渡到语义网络、表情识别,再发展到不经过文字转录和标识的语音、视频情节搜索等高度复杂的场景。因此,对数字出版流的感知必须借助AI更敏捷和健壮的复杂决策能力来完成。

  人工智能对数字出版流的感知,也包括对用户行为和心理状态的捕捉。人工智能依托多元传感器,通过主动输入或被动输入的方式感知人的行为和心理状态。这种基于个体生理数据记录的注意力抓取将杜绝现今泛滥的虚假流量及其伪装出来的注意力,因而这种多元传感模式下的感知精准度将得到显著性提升。例如,利用智能手环捕捉用户阅读时所在的位置、活动、心率等数据,随后分析其在阅读时所处的时空和情绪,实时感知用户行为轨迹和心理状态,并借助边缘计算的快速分析和网络切片的分层递送,超低延迟地对后续算法模块产生影响。

  2.挖掘:精准与深度分析数字出版流

  挖掘算法模块的功能是对感知到的数字出版流进行解构,并分析其背后的意向,简单说就是负责数据分析。人工智能提供了专业的分析能力,在选题策划、作者筛选、受众分析、内容创作、渠道分发等方面提供更准确的分析。

  就选题来说,挖掘算法对所捕获的热门话题进行多维分解,区分话题的所属领域,进行行业热点分析。同时,拆分该话题的内容特征,展开数据结构、核心议题和观点、关联话题、标志性节点、公众态度等维度的分析,以辅助选题和组稿。挖掘算法也可用于辨别话题中的意见领袖,分析其创作能力、立场、风格等特点,服务于作者筛选。发行方面,算法对参与话题用户的行为数据进行拆解,区分人群特征,分析其基本属性、心理偏好、行为意向。例如,在挖掘用户行为意向之前,人工先给定一些行为标签,例如黏性、活跃和产出等指标,随后用随机森林算法去训练程序标记目标和非目标用户,再用训练好的算法去区分未标记的用户中哪些是目标用户。

  借助5G网络的边缘计算,人工智能在高速、低延时的环境下运行,算法将能够实现对数据流的实时解读,不断提高精准性,并开展深度分析。一项更加具有前瞻性的深度分析技术是一种计算机视觉分析技术——情境关联搜索(context associated search)。该技术可以广泛应用于数字出版的选题和内容生产环节。所谓情境关联搜索,是对文本、音频、视频片段等形式在特定情境中的特定含义进行辨别。比方说,同一个关键词的含义会因为置身于不同的语境中而不同,情境关联搜索就是要分析特定场景环境中该词的语义,并搜索与之相同含义的关键词、语音、视频片段。AI的算力将使情境关联搜索成为现实,且该技术所需的高通量、高复杂度的运算只有在5G网络的加持下才能顺利实现。

  3.预测:构建模型及预判趋势

  5G环境下,人工智能算法对大容量数字出版流的感知和挖掘,将有助于算法在数字出版的信息采集、内容生产和分发等方面构建更加精准的模型。预测算法模块的功能是训练持续进化的动态模型,使对目标对象的预测与实际情况之间的误差达到最小。先期条件下,预测模块则对应选题策划、内容生产、发行推送环节,即对信源、生产和市场环境中多重对象进行建模和预测。

  以用户画像为例,在挖掘算法完成对用户的个人属性、偏好、行为、需求等标签的分拣之后,预测算法把这些数据组合起来刻画出完整的用户画像。刻画用户画像的过程就是建模的过程。除了用户建模,预测算法模块也可以用于数字出版的其他环节,例如,出版社可以用预测算法构建印数决策模型,实现精准印数预测。预测模块也可用于众筹出版等大规模生产整体进度的时间节点预测。

  过去由于人类认知的局限,需要把异质流变的数字出版流简化为标签来理解。而标签是对数字出版流的降维表达,有时是含混和残缺的,但5G赋能下的AI将带来运算能力的飞跃,预测算法构建模型的过程将被训练得更为迅速。将来AI对数字出版流的建模可能超越现存所有的分类标签系统,这意味着通过大样本的概率运算,AI对高速、全息、混杂数字出版流的预测将成为可以预见的未来。

  4.推断:匹配模型及实施决策

  推断算法模块指具有认知功能的智能体根据预测模型做出推断性结论,并实施决策。[7]数字出版语境下,确定选题、制定策划方案、生产内容、编辑审校、实施渠道策略、执行推送方案都属于决策算法模块的功能。推断算法模块就是人工智能算法根据模型预测,动态规划出最优实施策略,并配置一系列参数,进而实施各项方案。4G网络中的决策是由网络中处于枢纽地位的服务器承担,随后将决策内容发送至各个节点。而5G网络中各节点均具有运算能力,大量决策可以从分布式智能基站发出。这有助于短程化响应用户个性化需求。

  推断算法模块中,强化学习是其中最常用的算法。强化学习可以帮助数字出版主体根据不同环境、规则的变动而实时决策。例如《纽约时报》在线版的“石头、剪刀、布”系统利用一个人出手势的倾向和模式来获得优于对手的优势。[8]强化学习算法也可实时决策内容的推送方案。譬如色拉布(Snapchat)整合视频片段、图文所创建的搜索界面,能够在用户的每一次滑动和点击中快速学习。[9]

  5.创作:自主或辅助创作数字内容

  人工智能将依托5G的高速传输,实现数字文本、语音和视觉内容的高效、大体量生产。创作算法模块实际上是决策算法模块在内容生产领域的一部分。之所以单列出来,是因为近年来涌现出一批具有优势和特色的人工智能内容创作技术,其将对数字出版产生重大影响。

  创作算法模块借助自然语言处理(nature language processing,NLP)、生成对抗网络(generative adversarial networks,GAN)、循环神经网络(recurrent neural networks,RNNs)等算法,来创作可供人类认知和理解的数字内容。从现有理论和技术来看,高质量的自然语言处理系统仍是长期的努力目标。目前,具有一定自然语言处理能力的应用大量涌现,典型的包括机器人写作、画图、审校等。根据算法在创作中担当的角色,可将人工智能内容创作划分为自主创作和辅助创作。

  人工智能自主创作。人工智能自主创作,指的是人工智能算法在创作中处于自主地位,对感知的数据自主加工,形成数字内容成品。微软推出的AI绘图机器人,能够根据文字描述创建一个与之相应的图像,并可在画中增添一些细节。该项技术运用了深度学习和生成对抗网络等算法。首先是算法在配对图像和标题的数据集上进行深度学习训练,该训练能够使其理解如何将相应的单词与图像匹配。例如,当出现“鱼”这个词时,算法先画一只鱼,通过深度学习来理解鱼的形象。随后,生成对抗网络算法执行画图工作。生成对抗网络算法是由两个相互博弈的神经网络构成的,一个是生成器(Generator),另一个是判别器(Discriminator)。生成器负责输入并生成数据,判别器则负责分析数据,区分数据是真实的(来自数据集)还是虚假的(来自生成器)。一旦生成器成功骗过了鉴别器,让鉴别器认为生成的这张图像是真实的,一幅人工智能所作的画就诞生了。[10]两个神经网络的竞争能够创造高质量的图像。目前,生成对抗网络算法被应用于众多数字出版领域,例如二维/三维图像、视频的创作等。

  而机器人写作则主要运用自然语言处理技术。今日头条张小明(Xiaomingbot)综合运用该项技术,从数字出版流感知、文本生成、句法分析,到润色,再到推送。Xiaomingbot甚至可以运用情感分析技术,根据内容自动使用含有感情色彩的词语,如“实力不俗”“笑到最后”等。[11]由新华智云研发的智能生产平台Magic,2018世界杯期间生产的世界杯短视频新闻超3.7万条。目前,AI对体育和财经新闻的自主创作已近成熟。

  人工智能辅助创作。人工智能辅助创作指的是人工智能算法为人类内容创作者提供内容加工、纠错、提取信息等辅助。例如,文字校对(text-proofing),在创作者输入文字时,算法自动纠正错别字、术语或给出建议词。智能排版(intelligent typesetting),匹配相应的版式快速组版,并结合实际需求动态调整排版形式。内容审核(content approval),监测文本内容,包括网站内容、用户评论等,自动识别文本中可能存在的恶意、垃圾和敏感信息,并对文本自动审核与过滤。

  三、智能化数字出版流程的全新特征

  5G环境下,数字出版聚合人工智能“SMPIC”算法模块,通过优化组合和创新,实现生产流程的重塑。人工智能在5G环境的支持下高速地感知、挖掘、预测、推断和创作。伴随这一过程,智能化数字出版流程将呈现人智协同和低延迟两大特征。

  1.人智协同

  算法不是万能的,它是人类创造的工具,其效用只有与人协同才能获得最大化。[12]人智协同就是指人工智能算法辅助人类完成数字出版的选题策划、内容生产、编辑审校、发行推送、反馈互动等流程的智能革新,实现内容和场景适配的精准感知、挖掘、预测、决策和高效生产,构成人智协同的数字出版新业态。

  智能化数字出版流程的重塑需充分重视构建人与人工智能的协同机制。随着人工智能技术的深入,未来的数字出版场景蕴含了“人-人工智能-终端”构成的物理结构,“SMPIC”算法模块在多维传感器技术加持下,将实现对物理环境中人的多元感官数据与信息环境中多模态数字出版流的双向精准感知、深度挖掘和预测。而随着5G技术联结和产生的巨量数据,信息茧房、信息过载、数据滥用、隐私和技术公平性等算法伦理问题也将凸显。[13]在当前AI算法尚未充分建立道德和价值评判机制的现状下,需要充分考虑运用人工介入的手段来主导价值判断。在审核、创作等涉及决策步骤的推断模块中,需充分重视人类的把关作用。

  2.低延迟出版

  由于5G和AI在数据传输和处理方面的巨大改进,将为数字出版流程带来低延迟特征。低延迟出版指的是在5G高速传输的助力下,“SMPIC”各模块之间的决策关联得到加强,从感知到决策制定的延迟更低。在5G智能化物联网的加持下,已然实现的按需印刷将更进一步,实时感知出版需求,真正实现从端到端的实时印刷。区别于以往的即时出版,低延迟出版将借助传感设备实现感知维度的增容,这将伴随交互响应需求的增长。低延迟出版还将高度动态地对接出版需求,极大地突破时空制约。5G的低延迟传输可最大限度地消除传感设备与运算节点的数据连接和数据处理的时滞,保证用户在神经生理传导无法察觉的时间差内实现多元感官和场景的统一,从而实现数字出版流介导的感官间协调和与现实物理环境的全面连接和同时共现,实现数字出版场景的指数级增长。

  同时,当前VR等内容体验中的视觉眩晕、感官不协调、场景难融入等问题在5G和AI的加持下将得到有效解决。在5G高复杂度、高运算速度的数字出版流环境中,AI对数字出版流的低延迟出版,将延伸到对VR/AR、全息影像等环绕式、无焦点、多视点和动态场景内容的出版。AI将更加“理解”数字出版流的主题、结构、重点、意蕴和情感,生成用户的多元情境意向,进而低延迟地为数字出版过程提供场景适配的精准决策方案。

  注释:

  [1]周荣庭.网络出版[M].北京:科学出版社,2004

  [2]邱洪全,李伟铭,陈静.基于共生理论的厦漳泉物流产业协调发展研究[J].商业经济研究,2017 (15)

  [3][5][7]王威丽,何小强,唐伦.5G网络人工智能化的基本框架和关键技术[J].中兴通讯技术,2018(24)

  [4]Rongpeng Li, Zhifeng Zhao, Xuan Zhou, Guoru Ding, Yan Chen, Zhongyao Wang, Honggang Zhang.Intelligent 5G: When Cellular Networks Meet Artificial Intelligence[J].IEEE Wireless Communications.2017(10)

  [6][9]王昀.智能时代媒体传播业务链的转变与启示[J].青年记者,2018(9)

  [8]张超,闪雪萌,刘娟.从去专业化到再专业化:数据新闻对数据科学的应用与趋势[J].中国出版,2019(9)

  [10] Alec Radford,Luke Metz.Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[C].International Conference On Learning Representations,2016

  [11]今日头条人工智能自动写稿,背后藏着什么黑科技[EB/OL].https://www.eefocus.com/component/399785/r0

  [12]程忠良,马骁.人工智能时代出版业“数据+算法”运营模式的关键[J].科技与出版,2019(7)

  [13]陈昌凤,翟雨嘉.信息偏向于纠正:寻求智能化时代的价值理性[J].青年记者,2018(9)

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号