【作 者】星辰 刘:中国传媒大学互联网信息研究院;倩许:中国传媒大学艺术学部
【摘 要】随着人工智能在语音识别、语义识别、机器视觉、数据挖掘、深度学习等多个领域的技术突破,人工智能技术正日益嵌入新闻出版业的应用场景与业务生态体系之中。其中,机器人写作有效提升了新闻生产的效率与精确度;数据算法、语义识别以及图像识别正在成为网络新闻的分发人与“把关人”,为受众推送个性化信息;语音助手、智能音箱等新闻信息交互模式的转变提升了信息消费过程中的受众情感体验。人工智能对新闻出版业态传统范式的不断冲击,引发了人机冲突、信息茧房、新闻伦理等新的问题。本文拟对当前人工智能在新闻业的应用现状进行深入分析,以期能从中管窥人工智能技术与新闻出版业间的内在关系、互动规律,以及未来发展格局。
【关键词】机器新闻;人工智能;新闻生产;信息茧房;新闻分发
2016年被称为“人工智能元年”,这也是人类史上人工智能的第三次热潮,但不同于前两次,这一次人工智能复兴的最大特点是,AI在语音识别、机器视觉、数据挖掘等多个领域走进了业界的真实应用场景,与商业模式结合,开始在产业界发挥出真正的价值。人工智能先驱皮埃罗·斯加鲁菲在其《2017未来媒体报告》中指出,人工智能与机器人写作是未来媒体十大发展趋势之一。机器写作解放了人的生产力,算法改变了传统新闻分发渠道,人工智能与更多技术的结合带来了全新的阅读体验等,人工智能与新闻出版的融合呈现出一种全新的发展势态。
1 人工智能对新闻出版业态的范式重构
1.1 新闻生产过程自动化,效率提升成本降低
机器写作是人工智能影响新闻出版业最直观的体现,2011年Narrative Science使机器新闻写作进入公众的视野!翔,在此之后机器写作开始大规模地进入新闻生产,如2014年美联社与Automated Insights公司达成合作采用该公司研发的“Wordsmith平台”进行财经类、体育类新闻的日常写作;国内最早应用机器写作的则是腾讯采用自研发平台“Dreamwriter”完成《8月CPI同比上涨2%创12月新高》稿件的撰写。
新闻的采写由人让渡于机器实现了新闻生产的自动化,新闻生产效率得到大幅提升,同时节约了人工成本,更好地适应了目前受众更倾向于消费“短平快”内容的趋势。移动互联网使得受众的阅读习惯发生了改变,碎片化阅读需要大量内容的填充,这提升了对从业人员生产效率的要求。然而,人力毕竟是有限的,机器新闻写作则正好弥补了人力的不足,尤其是在时效性较高的突发新闻、体育新闻领域。
同时,机器写作能力的提升使得机器也将在更大范围内替代人工,全面提升新闻生产的效率。在机器新闻写作中,最为核心的技术为“自然语言处理(NLP)”,自然语言处理属于人工智能领域的一个分支,在机器新闻写作的文本生成环节起到重要的作用。而自然语言处理的技术发展已经进入了全新阶段,机器的语义识别功能愈加强大,愈来愈多情感机器人的出现就是最好的佐证。我们将视野放到更宽广的机器写作领域,就能看到在文本生成上机器的潜力,微软在2017年5月推出了第一本由人工智能机器人小冰写作完成的诗集《阳光失了玻璃窗》,并于2017年7月上线了最新功能“少女诗人小冰”,用户只需要上传图片,小冰就能根据图片内容进行诗歌创作。虽然小冰的写作并不是新闻写作,但我们能看到机器对于人类文字的掌控力正在逐渐提高,相信不久后机器写作在新闻叙事方面的相关技术就能取得突破。
随着机器视觉与AI技术的提升,在新闻图片的处理上,机器也慢慢替代了人工,在对于大量图像的识别与制作过程中,机器有着人类无法比拟的效率与精确度。2017年双十一期间,阿里采用了智能设计机器人“鲁班”独立设计了1.7亿个广告横幅(banner)。当这些技术被应用到新闻领域,新闻图片的处理效率也将会大大提升。
1.2 算法推送满足受众的多样性需求,开拓了新闻的长尾市场
传统媒体时代,报纸的版面与电视的时段都是有限的,出于对经济利益和人力成本的考量,新闻内容往往聚焦于20%的热点事件,这是“二八法则”在新闻出版业的体现,也就意味着有80%的新闻内容未被报道,受众的大量内容需求得不到满足。互联网的出现在一定程度上改变了这种局面,互联网的广袤容量使得传播渠道增多、传播成本降低,自媒体的兴起使从业人员增多,带动小众内容的生产,互联网普及率的持续攀升使受众有更多机会接触他们更感兴趣的内容。
然而,互联网并没有从根本上撼动新闻出版业的“二八法则”。就新闻生产来说,互联网时代的新闻生产依旧由人来完成,只要是人就会有时间与精力的限制,报道面就是有限的。分发渠道是互联网没有颠覆新闻业“二八法则”的根本原因,互联网时代用户获取新闻的主要渠道为各大客户端热点推送与自主搜索,并不是每一条内容都能精准地被推送给对此感兴趣的用户。基于这些原因,互联网媒体依然在关注网络热点并偏向于报道这一部分内容,例如,微博内容的日趋同质化就是互联网时代新闻出版业的“二八法则”依然存在的体现。
人工智能的到来颠覆了新闻出版业的“二八法则”,大数据技术使得受众的需求被精确计算,此前由记者进行内容选择并推送给受众阅读的过程全部交给机器来完成,每一条被生产的新闻都能精准抵达对此感兴趣的用户。今日头条就是采用算法推送内容的代表产品,相较于传统新闻客户端,今日头条扮演的角色更偏向于个性化推荐师,通过数据挖掘实现互联网内容的聚合,通过对每一个用户行为习惯数据的分析将信息过滤并为用户推送个性化定制内容。今日头条的成功正是基于这样的个性化推荐,尤其是在亚文化不断崛起、用户个性化需求日益增加的时代,今日头条依靠关注每一个用户的需求在众多新闻客户端中突出重围。据统计,2017年今日头条平均每日发布50万条内容,创造超过48亿次内容消费,数目庞大的创作量与消费量是传统媒体无法比拟的,而其平均每条消息高达一万的阅读量更是证明在算法的支撑下每一条信息都被精准推送到了需要它的用户手中且被阅读。精准的推送加上机器写作的无精力限制甚至能实现新闻内容的个人定制,这将使得哪怕是仅有1%的人关注的内容也能被生产且被精确地推送给对此感兴趣的用户,并获得经济的收益。这对于新闻业的经济格局是一场革命性的变动,新闻业的“二八法则”将不复存在,每一个用户的个性化需求都能得到满足,长尾市场被充分挖掘。
1.3 信息交互模式革新带来全新的阅读体验
美国阿尔文·托夫勒曾在《未来的冲击》一书中预言,经济发展经历了农业经济、制造经济、服务经济等浪潮后,体验经济将是最新的发展浪潮。大呼体验经济时代已经来临的约瑟夫·派恩认为,我们正迈向体验经济时代,体验经济将取代服务经济。进入体验经济时代之后,新闻出版业依然维持在消费内容的时代,贩卖内容依然是新闻业获取经济利益的主要途径,单一的经济模式函待变革。人工智能时代的新闻业将更加看重新闻消费的过程,体验比信息内容本身变得更为重要,《2017未来媒体报告中》写道:“未来的新闻是用来体验的,而非仅仅用来阅读。
人工智能使得新闻的消费过程更加互动。随着语音语义识别技术的提升,它们也被应用到了新闻业,2017年两会期间,人民日报首度使用了智能新闻机器人“小端”,用户通过文字和语音提问就能获得相关答案,新闻的获取由原先的单方面看新闻变成了过程更为有趣的交互式获取,“小端”还能通过分析用户提问的数据洞察需求以更好地满足用户的使用体验。人工智能技术的演进将继续丰富新闻获取的交互模式,未来的新闻获取势必不再是单一的传受关系,传播者与受众都将深度融合于传播过程之中,从而成为内容的一部分。
2 人工智能时代新闻出版业面临的问题
技术在带来机遇的同时,往往也会带来新的问题。人工智能重构了新闻生产、分发以及消费,新闻出版业呈现出新的景象,但其带来的间题同样不能忽略。
2.1 职业记者的全面转型
新闻机器人的到来被视为记者的潜在替代,未来记者将处于什么样的位置,从事什么样的工作,目前还没有定论,不少学者普遍认为基于机器能力的限制,记者的工作依然十分重要。喻国明教授认为:“机器新闻多是对既有模板的套用,属于流水线似的生产,规范却呆板,容易导致人的审美疲劳。机器新闻写作从应用领域看,主要集中于体育赛事、财经报道、突发事件等高数据密度、高信息透明度、低语境的新闻报道中。
然而,从上文对技术演进趋势的探讨中可以看到,机器写作的能力愈加强大,能处理的领域越来越宽广,不仅仅是文字撰写和图片处理,还可以采用无人车进行采访获取信息,新闻生产过程甚至会完全排除掉人的角色实现全自动化生产。
未来记者的定位还需要从人工智能的弱点中寻找答案,人工智能并不是无所不能的,在跨领域推理、抽象能力、审美以及情感等方面都远不及人。从这些角度出发,笔者认为,未来记者的角色将存在重大转型,主要集中在以下两个方面:一方面,记者在未来将更多地充当“把关人”的角色,新闻媒体不管在什么时代都应该担负起对社会的责任,机器并不具备对新闻价值评判的能力,什么样的新闻不该被报道,人工智能并不能做出判断;另一方面,机器不具备对意义进行理解的能力,机器虽然能对新闻事件进行精确地描述报道,但无法对这些事件进行意义的阐释,未来的记者将更多充当事件意义“阐释者”的角色。
2.2 信息茧房效应的增强
算法改变了新闻的分发模式,人工智能为受众过滤了大量的无效信息,将受众最感兴趣的信息推送至用户,增强了信息推送的有效度,然而这将导致受众长期沉浸于同质化的消息无法接触到纷繁复杂的真实世界。
桑斯坦在《网络共和国》一书中描述了“个人日报”现象,他认为,在互联网时代,伴随网络技术的发达和网络信息的剧增,我们能够在海量的信息中随意选择我们关注的话题,完全可以根据自己的喜好定制报纸和杂志,每个人都拥有为自己量身定制一份个人日报(Daily Me)的可能。这种“个人日报”式的信息选择行为会导致网络茧房的形成。“个人日报”现象在精准推送的时代更是变本加厉,受众习惯于新闻的自动推送,不再去接触兴趣之外的领域,并对领域之外的信息一无所知,导致了“单向度的人”的出现—受众满足于算法提供的信息从而失去了对外界的批判与反思能力。
新闻媒体应该有责任尽力避免受众“信息茧房”的形成,目前有效的做法是对算法的改变,使之更科学更全面地满足受众的信息需求,例如,通过设置某一类信息接触强度的临界值、扩大自动推送内容范围等。
2.3 其他伦理问题
人工智能应用于新闻出版业还存在着大量的伦理问题函待解决。例如,上文提到信息交互模式的改变将会影响传统新闻业的权利格局,新闻人在新闻的生产过程中避免不了受到新闻背后的权利关系的影响。相比之下,在机器人的叙事模式中,数据比话语修辞占了更高的比重,从而显得更加客观,也避免受到隐藏的权利关系的影响。但机器终究是人所生产的,算法规则也是人为制定的,在现有权利拥有者的影响之下,算法规则也会更加偏向于这群人,从而使得权利偏向更加严重。另外,机器通过修辞等创造的“拟态环境”是否会影响人的价值观也尚待观察。
3 人工智能时代新闻出版业的进化路径
当前,人工智能仍然处于弱人工智能阶段,人工智能虽已被大量应用到新闻出版业中,但其与新闻的融合依然处于磨合阶段。新闻出版业在人工智能的影响下还会进一步演化,人工智能本身的进化路径为我们探讨新闻出版业的进化路径提供了一些参考。
3.1 机器由写作向更高维度的管理演进
当前的人工智能主要被应用于新闻的生产和分发,而人工智能的进化潜力表明未来人工智能在新闻业中的角色将向更高维度演进——管理。
一方面,人工智能将更精确地对新闻真实性进行审核。由Joostware公司研发的“Who Said What”软件就具备了利用人工智能识别视频音频中引用内容真实性的功能。《纽约时报》在2017年也利用了谷歌研发的恶意评论识别工具对其新闻网站的恶意评论进行了实测。这意味着未来的新闻业可以摈弃掉人的主观偏向性,不再需要反复强调媒体的责任,人工智能对于虚假低俗内容的筛选会使新闻变得更加客观真实。
另一方面,新闻的生产与分发都依赖于内容的分类管理,也就是俗称的“打标签”,由于图片以及视频属于非结构化数据,所以现阶段对这类内容进行管理和推送还存在一定难度,但随着人工智能神经网络过训练的深入,机器将进一步提高对于内容的理解能力,人工智能在内容分类管理方面的效率也将得到优化。
3.2 信息视角的全面拓宽
算法造成了受众的信息茧房,目前的新闻个性推送软件都粗暴地根据用户第一次使用时输入的兴趣标签以及点击为用户推荐新闻,这种方式没有全面考虑到用户的多方位信息需求,将用户与其他信息隔绝开来。用户数据的不断积累以及平台间开源的分享将使得用户画像和用户标签更为丰富,计算机对于数据处理能力的提升也将带来更加优化的算法,用户将会收到更为丰富的信息内容。同时,大数据以及物联网技术的提升将使每一个人深度融入信息之中,成为信息的一部分,在内容消费之外,我们生活中的大量行为数据也被保留下来,这部分数据既能成为内容推送的标准,同时也能成为内容的原本素材,新闻信息将高度还原我们的真实世界。诚然,这样的转变会侵犯我们的隐私,但现代社会的隐私权应当被重新定义,用户也可以自主选择袒露或者不袒露自身的信息,相比之下,其带来的更全面的信息内容以及更科学的信息推送模式会被更多用户所接受。
4 结语
通过大数据技术对用户碎片化的内容实现结构性整合,在庞大杂乱的数据中挖掘出新的价值,这将给新闻生产带来一种更加全局性的视角。同时,在视频新闻生产领域,无人车的地面拍摄、无人船的水下摄影等,通过最大限度延伸人类的拍摄能力,可以无死角地呈现世界的全貌。人工智能使麦克卢汉笔下的“万物皆媒体”成为现实,随着人工智能加物联网的深度融合,我们的世界每时每刻都在被记录,受众的深度参与将给新闻生产带来全新的视角。