【摘 要】场景分类的应用越来越广泛,数字出版业要抓住机遇,迎接挑战,积极加入场景分类的行列,这对于满足用户的个性化需求、提升服务、实现数字出版向智能化升级有重要意义。本文结合数字出版的行业特点、场景分类的应用条件和技术现状,提出了场景分类应用于数字出版的具体措施。
【关键词】数字出版;场景分类;大数据;人工智能
基于大数据分析的人工智能时代已经到来,作为人工智能工作重要一环的场景分类正渗透到各个领域。现实驱动数字出版业转型升级。计算机、智能手机等阅读终端正在尝试根据用户所在场景有针对性地推荐数字出版物,这是一项非常具有挑战性和前景的工作。
一、场景分类的概念及原理
场景分类是指通过过滤、提取特征等操作,将原始的图片、声音、视频等数据与系统中存储的大数据相匹配,利用人工智能技术,识别出目前所处的场景类别。例如百度、谷歌每天都需要用场景分类技术对大量的图片、视频等信息进行分类。
场景可以分为四大类:自然场景、城市场景、室内场景和事件场景。虽然人脑能轻松地识别图片、声音、视频的场景,但这对于计算机、手机等设备来说,却是一件复杂和困难的工作。场景识别的关键部件是传感器和控制器。
1.传感器
传感器由视觉传感器、听觉传感器、触觉传感器、方位传感器和本体感受传感器等组成,通过对文字、图像、声音、位置等进行识别,获取外界环境的信息。视觉传感器可以识别图文、影像、人体动作;听觉传感器能识别自然界的声音、语音、音乐等各类声音;触觉传感器可以判断本设备与其他设备的连接状态;方位传感器可以定位;本体感受传感器可以感知设备倾斜角度、温度等。
2.控制器
控制器相当于人的大脑,对传感器传输过来的数据进行分析,再与内部存储的大数据匹对,分析出所处的场景,并控制使用设备做出合适的反应。例如数字阅读终端的触觉传感器识别当前设备与车联网设备连接,控制器分析后,识别当前为车内场景,推荐有声读物,保障行车安全。
二、场景分类应用于数字出版的必要性和可行性
场景分类目前主要应用于智能医疗、金融、汽车、零售、制造、安防等方面。对于出版行业,传统出版线下销售常引入场景化思维,例如书店少儿图书销售区的墙面设计了卡通图画,读书区布置了儿童凳、儿童桌,营造了适合少儿读书的场景。数字出版领域的场景应用处于摸索阶段,实际上,从行业特点和发展现状来看,数字出版具备应用场景分类的先天条件,场景分类有望成为助力数字出版发展的新引擎。
1.必要性
数字出版内容的丰富和形式的多样,为用户个性化需求的实现创造了物质条件,激发了用户场景分类的个性化需求。一方面,越来越多的传统出版单位加入数字出版的行列,数据库建设不断完善,数字出版的内容越来越丰富。另一方面,数字出版物的形态变得丰富多样,融合出版越来越受到青睐,用户不仅可以“看书”,还可以“听书”,甚至“视听结合”。这些都刺激着用户的阅读神经,激发了他们的个性化需求。
将场景分类应用于数字出版有利于满足用户的个性化需求。数字出版产品不仅面向垂直领域用户,还面向互联网用户,特别是互联网用户需求的多元化特征更加明显,因此,数字出版单位不仅要有垂直服务意识,还要有全民服务意识。没有场景分类,用户个性化需求的满足是有限的、局部的,甚至是盲目的,而场景分类适时之需,是迎合用户多元需求的有效途径之一。
场景分类能优化数字出版的服务。目前,数字出版业的服务离用户还有一段距离,虽然数字出版平台大都具有“猜你喜欢”“自动推荐”功能,但“猜”或“推荐”的内容与场景结合甚少。为了与用户形成共鸣,数字出版单位需要抓住知识服务的本质:没有脱离场景的需求。用户在不同的场景下,对知识和服务方式的需求会有所不同,只有结合场景,才能“猜”或“推荐”得更精准。场景分类实施以后,不再是简单地把知识信息推送给用户,而是根据大数据的分析,为用户匹配针对特定场景的出版内容和形态,实现与用户潜在需求间的智能响应。
场景分类正击数字出版目前的发展痛点,能提升运营效率,并衍生新的商业模式与盈利模式,推动我国数字出版产业由数字化、网络化向智能化转型和升级。
2.可行性
人工智能经历了计算、感知、认知三个智能阶段,而计算、感知和认识是场景识别必备的技术基础,因此,场景分类是人工智能发展到一定阶段的产物,而这个“阶段”就是现在。“场景为王”被认为是人工智能的发展趋势,场景应用被认为是各行各业发展的必然,并被成功应用于安全监控、人脸识别、智能机器人、无人驾驶等领域,为其在数字出版业的应用打下了基础。
场景分类应用于数字出版行业之初,主要集中在音乐、英语口语领域。2016年,QQ音乐推出可供听众自主选择的六大场景音效,分别是全景环绕、超重低音、清澈人声、现场律动、温暖轻柔、华丽复古。喜马拉雅FM等多个有声平台推出场景化英语口语学习音频。2017年,网易云音乐与1万家口碑商户合作,将趣味音乐与生活场景融合,甚至自制音乐以适场景之需。例如就餐于南京大排档的食客会听到诙谐欢快的《PVe do duck right》,就餐于四川某火锅店的食客会听到一首“应景”的神曲《好热》,情侣在某奶茶店会听到浪漫的情歌《爱呀》。2018年,人工智能产业链各环节的技术、物质、人员条件都已经具备,场景应用大范围爆发。小米公司推出的小爱mini智能音箱,其APP提供的“场景听歌”服务共提供了运动、睡觉、家务、冥想、起床、阅读六种场景音乐。2018年,除了数字音乐、英语学习,数字出版开始在更多的领域试水场景分类。如AR图书与智能机器人面部平板的结合,声控系统应用于数字出版物,智能机器人采写新闻稿,智能阅读等。相信在2019年,场景分类在数字出版行业的应用会越来越广。
数字出版具有数字化、网络化特点,数据可行性较强,具有加入场景分类行列的先天优势。例如电子期刊数据库、电子图书数据库、听书网、教育资源网、出版公众号等平台拥有丰富且高质量的出版资料和用户数据,为大数据的分析提供了依据。对于用户来说,无需了解数据的计算原理和过程,但对于数字出版运营商来说,前端的用户场景分类能助其实现“服务+”。
三、场景分类应用于数字出版的策略
场景分类的应用能给数字出版业带来结构性的调整,数字出版的服务理念、服务方式、出版目标、技术结构、产业结构都会发生巨大的变化。数字出版单位需要调整姿态,更新工作思路,积极采取措施,促进场景分类与数字出版的融合。
1.以“为用户提供个性化服务”为目标
场景分类技术的应用,带来了数字出版内容推荐方式的变化,如表1所示。
表1 场景分类技术应用前后数字出版内容推荐方式的变化
不同时期 | 数字出版内容推荐流程 | 应用情况 | |
场景分类技术应用之前 | 多次阅读行为(不分场景——大数据分析——内容自动推荐 | 目前内容推荐主流方式 | |
场景分类技术应用之后 | 方式1 | 多次阅读行为(结合场景定位)——大数据分析——出版单位提供场景及出版物列表选项——用户自主选择场景类别和该场景下的出版物 | 目前场景分类主流方式 |
方式2 | 多次阅读行为(结合场景定位)——大数据分析——不同场景内容的自动推荐 | 场景分类未来方向 |
场景分类技术应用于数字出版有两种方式:
方式1:场景类别、各类场景下的数字出版物列表等均由出版单位提前设计好,用户自主选择场景及出版物,如小爱音箱的场景音乐推荐。本方式是目前基于场景分类技术的内容推荐主流方式,是基于大众数据分析完成的推荐,不同用户看到的同一类场景的推荐内容是相同的。实际上,即使处于同一场景,不同人的阅读需求也会有所不同。例如夜间卧室场景有人喜欢阅读电子书,有人喜欢听书;再如有些用户阅读习惯与大众不同。因此,方式1能满足大部分用户的阅读需求,但会与部分用户的个性化需求产生矛盾。
方式2:智能终端通过运算和分析明确用户的当前场景,基于该用户之前在该场景下的使用行为数据,分析其喜欢内容,完成自动推荐。本方式主要是基于个人数据分析完成的推荐,针对每个人量身定制,是名符其实的“个性化推荐”,但为了避免出现信息茧房,要保证一定比例基于大众数据的推荐。方式2对场景识别技术要求高,难度大,对大数据的要求也更高。
用户在不同场景的使用需求会有所不同,如果条件允许,大家都希望能得到基于“兴趣+场景”的综合推荐。无论是方式1还是方式2,都要明确用户在不同场景的使用需求,以确保大数据分析的目标。为了保证服务质量,“兴趣”是首位,“场景分类”是为“兴趣”的个性化服务的。方式1是适合当前技术条件的内容推荐方式,但方式2是更优的选择,我们目前的任务是把方式1做细做精,争取早日实现向方式2的过渡。
2.针对不同场景开发的数字出版物,既可以是不同出版物,也可以是同一出版物的不同形态
针对不同场景量身定制、开发多部数字出版物需要较多的精力、财力、才力、物力。当前为场景分类应用初期,数字出版单位将同一出版物开发成适合不同场景的形态,是明智的选择,不仅有利于数字出版单位保持“体力”和“元气”,也有利于出版资源的高效利用。例如,为安静、静止的场景推送出版物的文本形式,为嘈杂、运动场景推送出版物的有声版或碎片化形式(不限于文本、视频、语音)。再如,某一数字出版物针对中年男性研发,但在不同场景中,用户的身份会发生变化,有时是公司职员,有时是父亲,有时是儿子,可以针对用户的特定使用场景,将同一出版内容研发成适合不同场景身份下使用的形态。
在网络时代,面对海量的内容,用户有很强的自主权和选择权,数字出版物在设计之初就要坚持“用户为本”,明确用户在什么场景下使用出版物,以及用户在使用出版物时是何种身份,有针对性地开发多种形式,才能真正为用户提供持续有价值、更具亲和力的服务,才能保持竞争力。
3.加强数字出版单位间的联合与数据共享
数字出版单位有各自的出版数据资源,但相互间的数据共享却非常有限,这不利于场景分类所需大数据的分析和数字出版的长久发展利益。数字出版单位、数字出版信息服务提供商约好利润分配比例后,需要加强数据融合和开放,抱团取暖,并共同致力于场景分类的研究,重视用户场景的开发和创新,加强场景应用,争取让数字出版尽快适应当前的新情况、新变化。
4.加强与科技公司的合作
与专门从事人工智能特别是场景分类技术研究的科技公司合作,能很好地解决数字出版单位场景识别所欠缺的技术、资金、人才问题。技术方面,学术有专攻,科技公司有一定的场景分类实践和摸索经验。资金方面,场景分类技术研发所需的资金非常庞大,目前,供需双方都存在资金较为紧张的局面,而数字出版单位与科技公司合作,作为需求方,面临的压力和风险会小很多。人才方面,目前最急需、最欠缺的是既懂数字出版、又懂场景分类的人才。一方面,数字出版单位与科技公司要加强深度交流与合作,尽快了解对方领域;另一方面,数字出版单位可以输送出版人才至科技公司参加培训或进行深造。
合作过程中,数字出版单位和科技公司之间不仅要协商如何细分用户场景,结合技术层面的现有条件细化服务,还要探讨如何优化和挖掘新的数据算法,为个性化推荐创造技术条件。数字出版单位要分清工作主次,在整个产业链中,精品内容永远是保证竞争力的根本。
5.加强与其他平台的合作
数字出版单位直接与微信、微博等具有强大用户群体的社交平台合作,不仅能获得分析用户场景、兴趣爱好、消费习惯等所需的直接或间接数据,为个性化场景推荐提供依据,实现快速提升,还能节约数据获取的人力、时间成本。数字出版单位因为高质量的内容资源受社交平台的青睐,双方的合作和资源共享能实现双赢。目前,越来越多的数字出版单位加入到与社交平台合作的行列,如出版公众号的建设,但是在场景分类领域的应用却很少,相信随着场景应用的推广,双方的合作会越来越深入。
数字出版单位可以与网络地图平台合作,借助定位确定场景。用户授权实时定位(打开GPS ),阅读终端可以获取位置信息,并通过网络实景地图识别场景。但是,网络地图因为录制条件的限制,只有主干道有场景影像,小道、公园内、房间内场景无法获取;另外,网络地图存在更新周期的问题。因此,在具体应用时可根据需要结合其他场景分类技术。总体而言,如果有网络地图和GPS的协助,场景分类会变得简单,准确性也能有很大提升。
6.绘制数字出版场景图谱
目前,数字出版场景分类碎片化、随意性特征明显,难以形成可持续运用的模式。关于数字出版物使用需求发生的场景特征、不同场景间差异的数据非常复杂,研究和绘制场景图谱虽然是一个大工程,但可以使复杂问题简单化,为未来数字出版的发展铺平道路。场景图谱的绘制,需要有足够多的大数据作支撑,各数字出版单位要同心协力,资源共享,并发挥各自在擅长领域的优势。
数字出版场景图谱绘制原理如图1所示,通过全网平台提供的“全网数据”分析获得“用户基本信息”及“用户在不同场景的兴趣点”数据,结合“场景类别”完成数字出版内容推荐。场景图谱中需呈现的信息内容源自图中红色实线框部分,根据需要可以对不同信息进行交又组合,如“00后女学生地铁场景数字出版物使用情况图谱”“初中在线教育用户情况及场景图谱”。

图1 场景图谱绘制原理示意图
图1是简略示意图,实际上,每一个细节都可能包含更加复杂的内容,以“用户基本信息”为例,除了包括性别、年龄、职业信息,还包括用户所在地区等信息;职业也可进一步细分,如学生可分为小学生、初中生、高中生、大学生、研究生,教师可细分为小学教师、初中教师、高中教师、高校教师……每一类教师又可再根据专业领域方向细分,如初中数学教师、高校研究化工领域的教师……而这些细节信息对用户的阅读兴趣和行为有直接影响。因此,场景图谱结构非常繁杂,但有了人工智能的技术基础,场景图谱的绘制会容易很多,甚至可以自动生成。数字出版单位可以根据自己的出版领域,绘制该方向的场景图谱,做到“小而精”,甚至可以根据个人全网数据,生成个人场景图谱,有了精准的用户画像,数字出版的内容推荐会更加精准。
场景分类近几年在学术研究、实际应用上不断取得突破,但真正渗透到数字出版产品的部分仍旧面临尚未攻破的短板。一方面由于场景的复杂性和多样性,同一场景受拍摄角度、光线、遮挡等影响会造成视觉上的差异,给场景的准确识别带来困难;另一方面,随着采集的数据越来越庞大,场景分类要求越来越精细,复杂事件场景、动态场景、通过语义识别场景都存在技术困难。正是因为这些问题的存在,场景分类在数字出版领域的应用普及还需要一段时间。场景分类与数字出版的结合是时代赋予的命题,也是数字出版步入深水区的必经之路。数字出版单位要坚持知识服务的本质,敢于尝试新技术,使数字出版融入到普通百姓的生活场景中,让知识的情感和温度得到扩展和升华。
参考文献
[1]张新新.新闻出版业智能机器人的应用原理及场景分析[J].科技与出版,2018(11).
[2]深耕音乐场景化QQ音乐将演唱会“装进口袋”[EB/OL].(2016-11-15).
[3]刘兴亮.场景化时代的音乐文化[EB/OL].微信公众号:刘兴亮时间,2017-12-22.
[4]群邑移动.互联网原住民•移动场景图语[J].中国广告,2017(6).
[5]王琼洁.人工智能+,场景应用时代已然来临[J].通信产业报,2018-03-26.
[6]李宁.人工智能助力场景化知识服务[N].国际出版周报,2018-08-06.
[7]贠天一.场景应用成为人工智能发展的重点[J].中国战略新兴产业,2017(11).
[8]陈步华.人工智能在运营商中的主要应用场景[J].广东通信技术,2018(3).
[9]王凡.人工智能产业生态逐步成形场景应用集中爆发[N].中国计算机报,2018-09-03.
[10]宗海燕,吴秦,王田辰,张淮.核协同表示下的多特征融合场景识别[J].计算机科学与探索,2018(6).
[11]王鹏涛.学术出版数据化决策创新研究:全流程、场景化与智能驱动[J].科技与出版,2018(12).
[12]王茜.人工智能与数据驱动下的出版业转型研究[J].科技与出版,2018(12).