业内信息

基于新闻出版行业的大数据战略初探

2021-05-21 来源:《信息系统工程》
  【作 者】王哲:中央宣传部机关服务中心(信息中心);江涟:中国软件评测中心(赛迪监理)

  【摘 要】近年来,国家高度重视大数据战略。与此同时,大数据也给新闻出版业带来了新机遇。数字阅读行为和网络购买行为等多方面积累的大数据,为传统新闻出版业的发展带来了一股新势力,但同时也产生了一些不可避免的新问题。新闻出版业的文化属性促使新闻出版大数据可以应用于行业全景链条当中,并且已经通过新闻出版大数据服务等平台将一些服务应用于行业。当前,新闻出版业正在充分利用大数据等信息技术革命成果,推动行业关键核心技术自主创新,为行业发展提供新动能。

  【关键词】大数据;新闻出版业;平台建设;行业发展

  一、背景与现状

  (一)党中央关于大数据战略的有关部署


  2017年12月,中共中央政治局就实施国家大数据战略进行集体学习。学习时强调,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好地服务我国经济社会发展和人民生活改善。2018年4月、2019年5月、2020年10月,国家互联网信息办公室牵头主办了三届数字中国建设峰会,峰会开幕式上提出,紧紧围绕数字中国建设,加快突破核心技术,推动基础设施优化升级,发展壮大数字经济,积极释放数据红利,让信息化发展更好造福社会、造福人民。2020年3月,党中央制定了加快新型基础设施建设和发展的意见,并提出实施全国一体化大数据中心建设重大工程[1]。

  (二)国家关于大数据战略的相关政策

  2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署了我国大数据发展工作,至此,大数据成为国家级的发展战略。2017年1月,工信部编制印发《大数据产业发展规划(2016-2020年)》,指出到2020年,技术先进、应用繁荣、保障有力的大数据产业体系基本形成。2019年8月,科技部、中宣部等六个部门联合发布《关于促进文化和科技深度融合的指导意见》,明确提出贯彻国家大数据战略,加强顶层设计,加快国家文化大数据体系建设,加快文化数据采集、存储、清洗、分析发掘、可视化、标准化、版权保护、安全与隐私保护等领域关键技术攻关。2020年5月,中宣部印发了《关于做好国家文化大数据体系建设工作通知》,指出加快宣传文化领域数字化转型,探索数据流通规则,实现领域内全部数据资源地汇聚流通、合理配置,深入推进政务数据共享开发,建设中国文化遗产标本库、中华民族文化基因库、中华文化素材库,构建宣传文化领域的数字化支撑平台。2020年9月,中共中央办公厅、国务院办公厅印发了《关于加快推进媒体深度融合发展的意见》,指出以先进技术引领驱动融合发展,用好大数据、云计算、物联网、区块链、人工智能等信息技术革命成果,加强新技术在新闻传播领域的前瞻性研究和应用,推动关键核心技术自主创新[2]。

  (三)新闻出版行业大数据现状

  一是数据量积累不充足。对新闻出版行业而言,由于没有构建贯穿知识信息的创作、生产、传播、管理、消费、应用的全产业链的大数据,就目前的出版行业内部数据而言,远远不能达到大数据应用的需求,更不能满足基于大数据技术的出版。

  二是数据真实性有待考证。当下社会公众的阅读需求呈现分众化、个性化、动态性特点,公众在选择阅读对象和实施阅读行为时,会受到各种外部因素的干扰,或附带较多的非理性的情感因素,甚至具有一定的盲目性,一部分公众对自身真实的阅读需求未必有明确的认识。因此,片面依赖阅读行为数据分析,由此推导出的有关阅读需求、阅读心理的结论就可能出现偏差。在市场体系不健全、社会阅读氛围有待改善的境况下,出版行业的大数据真实性就有待商榷。

  三是主导方向多边化。当今的新闻出版行业依然是一个强调内容积累、文化语境、知识传承的行业,有其政治性和引导性,很难做到只以用户为中心决定内容资源配置,主导生产模式、生产方向的依然是多边共同作用的结果。强调用户需求和大数据分析,可能会存在对用户的刻意迎合,进而会对作者的构思、生产和个性风格的形成带来消极影响,会降低内容的思想深度,最终对新闻出版文化生态带来不良影响。

  二、构建与突破

  (一)新闻出版行业本身具备信息天然属性


  新闻出版业不仅具有鲜明的文化属性,承载着传承文明、传播文化的使命,是文化产业的重要组成;而且还具有天然的信息属性,自诞生以来,一直从事信息采集与加工、数据汇聚与挖掘、内容生产与传播、知识沉淀与服务的活动,穿越历史,积累了大量有极高价值的数据,是信息产业的重要组成。

  新闻出版业在国家大数据战略中,具有重要和不可替代的地位。新闻出版业首先是大数据产生与应用的重要部门;同时,有别于其他产业部门,新闻出版业还是不可替代的数据生产与供应部门,特别是知识数据的应用服务部门。

  新闻出版业具有文化、商业、信息三种属性。信息属性是以信息描述、信息记录为手段,将信息进行传播的生产方式。掌握新闻出版信息属性的规律,是切实提高新闻出版传播力、发挥社会效益的根本保障。

  (二)行业链条的全景数据应用

  新闻出版业行业链条简单来看可以分为创作、生产、传播、服务等多个阶段,每个阶段可以分为产业外数据、生产的数据和产生的数据等几个类型。

  创作阶段产业外数据包含作者、作品等,生产的数据有内容资源数据、知识资源数据,产生的数据有内容资源元数据;生产阶段产业外数据包含出版机构、产品,生产的数据有产品数据,产生的数据有产品元数据;传播阶段产业外数据包含发行机构和市场,生产的数据有市场数据,产生的数据有销售数据、订单数据等;服务阶段产业外数据包含服务机构和用户,生产的数据有消费数据,产生的数据有阅读行为数据、购买行为数据、地域分布数据、教育背景数据、收入状况数据、群体分别数据等(如表1所示)。


表1  行业链条的全景数据应用
  创作阶段 生产阶段 传播阶段 服务阶段
机构数据 作者团体 出版机构 发行机构 服务机构
介质数据 作品 产品 市场 用户生
产的数据 内容、知识资源数据 产品数据 市场数据 消费数据
产生的数据 资源元数据 产品元数据 销售数据、订单数据等 阅读、购买行为数据等

  各类大数据经过采集、汇聚、加工、分析形成成果,一是可以服务于政府用户,为各级、各类政府部门治理决策提供支持;二是可以服务于行业用户,支持其提高资源管理的可控性,指导其有效再生产,减少库存、降低成本,支撑其建立知识服务为引领的新业态、新模式,最终实现有效供给,推动行业供给侧结构性调整;三是可以服务于公众用户,为研究机构、社会公众提供各领域知识服务,支持学术研究与教育学习、文化消费;四是可以服务于产业用户,为各领域产业部门提供新闻出版行业数据,特别是知识资源数据,以知识服务支持生产活动;五是可以为各类用户提供基础数据开放服务、大数据咨询分析服务、研究报告、数据关联解析服务、智库服务等各类需求侧的服务。

  (三)行业数据应用的关键节点突破

  自2015年大数据上升到国家战略以来,新闻出版行业非常重视大数据战略与新闻出版的融合,及时对大数据中心建设进行了宏观规划、顶层设计,提出了建设新闻出版大数据服务平台。出版发行数据产业服务平台、网络出版物数据产业服务平台和新闻出版大数据应用工程就是新闻出版大数据服务平台的子项目。

  出版发行数据产业服务平台主要是立足于统一性、综合性、全方位性几个方面,汇集政务公开数据、公共服务数据、采集社会化数据及其他数据。平台立足于国家大数据发展战略,为国家宏观调控科学化和行业监管精准化提供可能;为出版业提供优质准确快速的出版物选题决策等数据支撑服务;为提升全民阅读等公共文化服务质量提供数据支撑服务;推动整个中国出版产业提升经营能力、促进产业升级、繁荣出版文化,从而帮助中国文化产业大发展大繁荣。

  网络出版物数据产业服务平台主要是推动产业融合发展,增强产业数据应用能力,推动新闻出版业供给侧改革,提升产业运作效率,促进网络文学IP转化,提升政府行业治理能力,引导新兴产业良性发展。平台以网络出版物的基础信息发布服务和网络文学作品的质量保障为基础,为上下游单位和行业主管部门提供综合数据服务。平台针对网络文学质量参差不齐的现状,建设智能质量保障系统,构建语义分析库,建立网络文学质量判定和修正模型,对网络文学的内容质量开展检测和质量提升服务。

  新闻出版大数据应用工程主要是基于业内大数据的汇聚与应用,以公共服务与产业服务相结合,推动新闻出版业数字化转型升级。工程成果可以汇聚新闻出版业5000余家新闻出版机构的内容资源与产品元数据;近1000家书店、电商平台和图书馆的机构数据与库存、流通、交易数据,以及内容消费者阅读行为数据等各类市场数据;覆盖20个以上专业领域的知识资源数据,开展面向行业内、外部产业、政府、社会公众四类用户的数据应用服务,推动新闻出版业及外部产业开展供给侧结构性改革。 工程将建成统一的服务平台、建设上百个数据资源库、汇集内容数据超过200亿条;关联数据分配量达到10亿条、数据存储容量突破3PB;预计服务范围覆盖超过20个以上专业领域、服务用户数量约为3亿人次;年数据处理规模为120亿条、日访问量达千万级。

  三、建议与展望

  (一)机制方面


  近年来,行业主管部门一直在为打造宣传思想领域统一“大平台、大数据、大系统”做准备,大数据中心建设工作也势必成为新闻出版行业“十四五”时期的重中之重。接下来,相关部门主要还要抓好以下几项重点工作:

  一是积极落实《关于做好国家文化大数据体系建设工作通知》,推动新闻出版行业抓住“新基建”风口,认真研究实施计划,建立“大而全,大而精”的信息数据库群,保证信息资源的畅通流转,实现全国数据资源联合共建、共享。

  二是推动制定相应的政策法规,在新闻出版行业层面出台大数据建设和发展有利政策,在经济、技术、人才培养等方面予以大力支持。

  三是继续推进新闻出版大数据标准管理和制订工作,依托《大数据标准化白皮书(2016)》体系框架,不断完善新闻出版大数据标准体系。

  四是继续改革创新新闻出版行业大数据相关体制机制,着力推动新闻出版行业完善数据共享和协调机制、数据收集和统一发布机制等,保障数据汇聚流通相关工作科学高效推进。

  (二)共享方面

  《促进大数据发展行动纲要》提出了大力推动政府信息系统和公共数据互联开放共享的理念。李克强总理在近几年的政府工作报告中强调,大力推行“互联网+政务服务”,实现部门间数据共享。要加快新闻出版行业公共数据开放共享,一是要统筹规划各单位的数据使用方式,厘清各单位数据管理及共享的义务和权利,建立公共机构数据资源清单和数据统一共享交换平台;二是加快全国范围信息系统的互联互通和信息共享,实现新闻出版发行等多方数据共享、制度对接和协同配合;三是通过政务数据公开共享,引导新闻出版单位、行业协会、科研机构、社会组织等主动开放数据。只有数据汇聚流通、合理配置,才能加快新闻出版领域的数字化转型。

  (三)安全方面

  第一,新闻出版相关单位要认真贯彻落实《网络安全法》《刑法》的相关规定,制定个人信息保护合规政策,清晰地界定经营行为的法律边界,表明单位对违法违规行为的禁止态度。

  第二,在数据保存环节,单位应根据实际需要对个人信息做“去标识化处理”,并将去标识化后的数据与可用于恢复识别个人的信息分开存储,确保在后续的个人信息处理中不再重新识别个人。

  第三,向他人提供公民个人信息,需要遵循三项基本原则:一是经过被收集者同意、授权;二是未经被收集者同意,则所提供的信息进行匿名化处理,或者经过处理无法识别特定个人,并且不可复原;三是确保信息接收方具有合法的使用目的,避免个人信息被用于违法犯罪活动。

  第四,要通过建立合规体系来避免承担因管理失职所带来的责任承担问题,要建立一套较为完整的个人信息保护合规政策,履行信息网络安全管理义务。

  参考文献

  [1]眭海霞,孙清.大数据时代下的网络文化传播分析[J].成都理工大学学报,2017,25(1):102-106.

  [2]报刊记者.大数据出版若干问题探析[J].编辑之友,2016,8:12-18.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号