业内信息

出版物唯一标识符编码UIP应用研究探讨

2019-11-28 来源:《出版发行研究》
  【作 者】林杰:北京理工大学

  【摘 要】无论是传统纸质出版物,还是数字(电子)出版物,乃至互联网出版物,都因缺少出版物唯一标识符,在编辑、出版(生产)、销售、服务等环节遇到很多无法解决的难题,如:盗版识别、渠道窜货、特价回流、隐藏交易数据等。本文从出版物唯一标识符的产生背景、编码规则、适用流程、应用意义等方面,详细阐述出版物唯一标识符在出版产业生态构建中的重要性,以及应用出版物唯一标识符产生的大数据对出版产业产生的重要作用。

  【关键词】出版物唯一标识符;UIP;出版企业;出版产业;大数据

  一、研究的必要性

  自20世纪六七十年代以来,全世界出版机构陆续使用ISBN、ISSN、ISRC等一系列国际标准编码对出版物进行标识编码。这些国际编码是出版物的品种级区分标识,其规范和统一了出版物的编码体系,起到了促进产业发展的作用。然而随着产业的深入发展,特别是数字出版等新的出版活动的兴起,这些仅能对出版物品种进行标识的国际编码,已经不能满足行业发展的深层次需求。行业发展急需一个能对出版物个体(册、张、个、篇等)、个体局部(章、节、片段、元素等)进行唯一性标识的编码体系,用以应对出版产业中各种复杂的个性化需求。

  (一)产业发展的迫切需要

  1. 信息引用及标识的需要

  出版产业的每一次飞跃都意味着技术发生了革命性的变化,从“铅与火”到“光与电”,再到目前的“数与网”。人类一方面在努力实现信息载体的变革,另一方面在努力探究信息的可重复利用方法。根据人类对事物探究的由表及里、由大到小,由宏观至微观等特点,为了实现人类知识和文化的传承,借鉴前人的经验与智慧,需要对信息进行整理、归纳、利用。并且在对信息进行整理、归纳、利用时,都不可避免地需要对信息进行标识,由此产生了对信息对象进行标识、关联和交换等方面的需求。

  2. 片段化阅读和营销的需要

  数字出版时代与之前的传统出版时代有一个明显的区别就是:读者可以不再为片段性的信息需求去购买包含该片段信息的整个媒介产品。因为在读者眼中只有有效可用的信息才是知识,所以片段化的阅读和营销需要对可利用的片段进行科学的标识。

  3. 产品层面有效识别个体的需要

  数字出版时代与之前的传统出版时代另一个明显的区别就是:传统出版时代,出版社与读者的沟通交流有限、甚至可以说是不畅,而数字出版时代,因为发行、服务都以数字化的方式进行,这就为出版社与读者进行直接的沟通交流提供了可能。为了进行有效的服务,不仅需要对读者进行唯一性标识,而且还需要对读者阅读的内容进行唯一性标识,将两个唯一性标识关联起来,进行读者阅读行为的分析,便于产生有价值的信息反馈,便于向读者提供更具个性化的针对性服务。

  4. 解决出版产业诸多症结的需要

  无论是传统出版时代、还是数字出版时代,出版产业均存在影响产业发展的诸多症结:版权保护手段单一(学术不端、盗版查处);渠道控制力不够(异价窜货、特价回流、交易不透明、沿用落后的赊销制、账期普遍过长等);信息收集处理能力弱(不直接接触读者、掌握不到真实的用户需求和阅读信息、企业内外“信息孤岛”普遍存在、无大数据分析能力等)等。究其根源在于:信息数据处理的粒度偏大,无法对出版物个体(或个体局部)实现唯一性标识。

  (二)现有编码及标准的局限性

  除广泛使用的ISBN、ISSN、ISRC等国际标准编码外,近年来我国也陆续发布了一系列标准,主要的有ISLI、CNONIX等。ISBN等提供了出版物品种级别的标识符方案;DOI提供了出版物数字对象个体的标识符方案;ISLI提供了对象标识符之间的关联方案;CNONIX解决了出版物在线信息、交换的数据标准性问题。但现有标准在适用范围上存在局限性,不能满足行业发展应用需求,有必要在此基础上构建新的编码体系,形成一个编码应用的良好生态。

  同时国内外也出现了多种针对国际标准编码的变种。这些变种从一定程度上突破了原编码只能进行品种级别标识的局限性,实现了对出版物个体进行唯一性识别。但依然不同程度地具有应用的局限性。如:有的能有效应用于传统出版物(图书、报刊、音像光盘等)、却无法应用于数字出版物(电子、互联网出版物等);有的能应用于数字出版物,却无法应用于传统出版物;有的虽解决了适应出版物媒介的问题,却在构建良好的应用生态方面提不出解决方案。因此,出版产业需要一个能对出版物个体进行标识的编码,同时构建一个编码应用的良好生态。本课题组正是基于这种需求,提出了出版物唯一标识符编码体系及应用生态构建思路。

  二、UIP应用生态思路的提出和设计

  本课题组基于上述研究必要性,经过大量的研究和实验,①提出“出版物唯一标识符”这一概念及其应用思路。

  (一)概念提出

  出版物唯一标识符(Unique Identifier of publication,简称UIP),是指基于一维码、二维码技术的出版物(包括纸介质、非纸介质)个体唯一性识别编码。它将编码标准与应用生态有机地结合在一起,有效地克服现有编码标识符体系存在的不足。

  UIP是用于区分出版物单个个体(本、册、张、盘、篇、章、节等)与其他任意个体的唯一标识代码。ISBN、ISRC、ISSN只适用于区分不同品种的出版物,是品种层面的区分标识,但无法辨别出某个品种中任意单独个体与该品种中的其他所有个体的差异。类似于告诉我们,在森林中,有一块区域的树种是松树,但无法区分这片松树林中的每一棵树,而UIP可以做到。UIP是国际标准编码ISBN、ISRC、ISSN基础之上的继承和延伸,它是在保留国际编码的基础之上,更多地赋予编码的功能和用途。

  为了能兼容和取代已有的编码规范和应用场景,UIP应符合以下应用条件。①普适性:不论是传统纸质出版物(图书、报刊、光盘、磁带、胶片、音像制品等),还是数字出版物、互联网出版物,均应有相应的编码规范。②兼容性:不能抛弃已有国际、国家、行业标准,要在编码中适度地兼容,同时要具备单字节字符、双字节字符的编码能力。③生态性:任何标识符不能仅仅是编码规范,应当与应用场景结合,符合产品特性和生产、流通、使用特性。④可行性:要符合现有政策条件、技术条件、设备条件、应用条件。⑤可用性:编码是为了解决实际问题的,需对出版产业出现的问题有较好的解决作用,任何无应用意义的编码,谁也不会去使用。⑥防仿制性:编码要具有较强的防破解算法,最低要求是从一份标识符编码值无法推算出一组标识符的编码值。

  (二)UIP应用生态的技术可行性

  UIP应用生态有赖于以下技术环境的成熟。

  1. 二维码技术的成熟

  一维码,也被称为条形码,编码字符一般为ASCII标准字符。但因为其包含的字符数较少,因此不能表达复杂的信息、包括双字节字符信息。

  二维码又称二维条码,是近几年来移动设备上应用较好的一种编码方式,它比传统的条形码能存更多的信息,也能表示更多的数据类型。中国也制定了两个二维码的国家标准:二维码网格矩阵码(SJ/T 11349-2006)和二维码紧密矩阵码(SJ/T 11350-2006),从而促进了中国具有自主知识产权技术的二维码的研发。

  2. 可变数据印刷技术的成熟

  可变数据印刷(简称VDP),是指每份印刷品或出版物上印刷各不相同的内容,包括文字、数字、图片、条码。以方正电子为代表的一批企业为可变数据印刷的实现和应用进行了较深入的研究和开发,已经成功地在药品等行业实现。这为纸质出版物进行唯一性个体编码印刷提供了可能性保证。

  3. 网络营销平台的兴起

  网络营销平台的产生与兴起,改变了出版产业传统的营销方式,为技术应用提供了强大的生存土壤,同时也为数字出版物唯一性标识的应用提供了基础平台。

  (三)UIP应用生态的普适性设计思路

  UIP可广泛适用于纸质出版物、电子出版物、数字出版物及互联网出版物。

  1. 纸质出版物思路

  运用可变数据印刷技术,将包含唯一标识符内容的一维码、二维码印刷在纸介质上,从而实现纸介质出版物的唯一性标识。

  因此有三点不能忽略:可变数据印刷技术、编码规则、应用逻辑。

  可变数据印刷技术:目前经过众多技术厂商的研发,印刷设备已经批量生产且投入使用。对于纸质出版物因采用可变数据印刷而导致的生产成本变化进行科学计算,目前已经能够将单册成本增加控制在0.07元以下,这是绝大多数出版企业均能接受的增量。

  编码规则:根据选题类别、申报单位、申报人、申报时间、印刷数、印刷机编号等生成一组数据。

  应用逻辑:出版单位申报选题,监管平台发码至指定编号的可变数据印刷机上、印刷后进行废码回告、印刷物入库时进行有效码确认、渠道或读者验码使用(销售、阅读)。

  2. 电子、数字出版物思路

  在产品购买按钮,嵌入唯一标识插件,用户只要点击“购买”按钮,便触发动作:一方面通过插件向监管部门(如广电总局)查询出版物是否备案、是否正版、另一方面通过插件传递本次交易出版物的唯一标识编码,该编码参与到所购买复(副)本的DRM加密中,最终生成购买个体的唯一标识认证,同时监管部门统计系统也及时获取了交易信息,起到交易的监管和公正作用。

  3. 互联网出版物思路

  由于互联网出版物的加工生产速度极快,且每天产生信息量达到EB级,使得监管部门不可能每一条信息都去审核并发放唯一标识编码。因此在应用设计时,应当着眼于互联网出版物的发布环节。在“发布”按钮嵌入统一插件,一旦出版单位点击“发布”按钮,便触发动作:将信息标题、正文等传送至监管部门数据库,同时自动获取唯一标识编码。监管部门只要采用抽检的方式就可以做到最大程度的监管,抽检内容包括:传送数量与实际发布数量是否一致;传送内容与实际内容是否一致;传送内容是否违反国家政策及社会公序良俗。一经发现有违规出版现象,则对于违规企业及时提出整改要求和处罚意见。

  (四)唯一标识符建议编码规则

  UIP组成包含两部分:一维码部分和二维码部分。两部分缺一不可。

  1. 一维码部分

  一维码部分,以原有ISBN、ISRC、ISSN等为基础,加上唯一顺序编码信息。

  一维码编码规则:ISBN(ISRC、ISSN等)+顺序码+校验位。

  校验位其生成算法是根据选题申报时间(信息发布日期)、选题申报单位(信息发布单位)、印数、指定印厂印刷机编号(发布服务器硬件编号)计算得出的,仿冒者很难了解到这些信息且算法不可逆,因此从某种意义上来讲具备较强的防破解、防仿制能力。

  2. 二维码部分

  二维码编码规则:由CNONIX标准XML文件URL、MARC数据URL、若干个附加资源URL、校验位1、顺序码、校检位2组成。其规范如下:

  <IMAGEDATA>

  <CNONIX>CNONIX标准XML文件URL</CNONIX>

  <MARC>MARC数据URL</MARC>

  <RESOURCE1>附加资源1URL</RESOURCE1>

  ……

  <RESOURCEn>附加资源2URL</RESOURCEn>

  <FLAG1>校验位1</FLAG1>

  <UIP>顺序码</UIP>

  <FLAG2>校验位2</FLAG2>

  </IMAGEDATA>

  二维码部分更多的是承载出版物标准数据传递、增值或附加信息服务功能。

  三、UIP应用生态对于产业大数据的意义

  UIP应用生态对出版物全流程的标准数据共享、知识产权保护、商品流通轨迹、信息推送、增值服务等方面都有着切实的影响,具体内容如下。

  (一)便于出版物全流程的标准数据共享

  UIP传递的CNONIX、MARC等数据信息本身就是一种行业标准和规范。且UIP真正实现了出版物与其配套资源数据一体化存在。UIP有效地提高了出版物的生产效率,加速了出版物的流通速度,同时间接促进了出版物后期营销。

  (二)有效解决盗版及盗版查验问题

  现代印刷、制作技术的提高导致仿真度较高的盗版层出不穷,而传统盗版查验技术:辨别纸张质量、核实出版企业、甚至在相关网站核查ISBN、ISSN、ISRN号等都不能万无一失地判断正版与否。UIP使出版物在尚未出版时,仅仅在印刷(制作)阶段开始就有了独一无二的身份辨识,并且各个流程尽在监管部门实时掌控之中,使得无孔不入的盗版商无机可乘。

  流通过程中的任何一个节点(比如:渠道商、读者)能以扫码的方式快速准确地查询出版物的真伪、节点轨迹,便于执行部门查处打击盗版。

  (三)规避营销风险

  UIP的身份识别的唯一性特点,可以将产品的流通轨迹清楚地呈现出来,能够有效地防止特价回流、异折扣渠道窜货给出版单位带来的差价损失,有效地帮助出版单位规避营销风险。

  (四)方便实现增值服务和信息推送

  出版企业为终端客户提供成本低且使用便捷的措施来进行配套资源(课件、音视频、动画、三维模型、仿真系统、网络课堂、习题考试资源等)的下载、浏览、使用。终端客户可以第一时间反馈问题,使作者、读者、出版社之间的互动性大大增强。

  UIP可以搭载URL信息,比如出版单位官方网站、出版物重点推介页面、购买活动及优惠政策等,突破出版物原始固定信息量的约束。如果把出版单位比作一棵树、单一出版物比作一片叶子,当叶子呈现给用户时,用户可以通过这片叶子看到其他叶子乃至整棵树、甚至是其他树。因此主管部门应鼓励出版企业树立品牌意识,给读者呈现更多的经过精挑细选的知识或信息,维护优秀作者队伍、延伸优秀作品的相关信息。紧扣渠道商、读者的需要,树立良好的出版企业品牌形象。

  (五)便于进行出版行为的宏观调控

  监管部门或出版单位可以准确掌握出版物每个个体在流通过程中的轨迹。从而掌控每种出版物的销售数据,对现有市场做出分析,以及未来市场做出评估预测。为市场的查漏补缺、优胜劣汰做出宏观调控。从而为市场的良性循环提出确实可靠的指导,有效抑制某一类出版物集中扎堆,导致市场盲目粗放型增长,抑或某类出版物严重短缺,造成供需失调。为出版产业提供唯一、权威的生产交易事实公正,增进产、销双方相互信任,维护公平交易、打击不诚信行为。

  (六)促进传统印刷业的产业升级

  传统印刷业在中国是个庞大的队伍,十几万家印刷企业不仅产能过剩、技术落后,也污染了环境。且中小印刷企业大部分属于家族管理或作坊式生产,管理混乱,抗风险能力差,印刷企业的产业升级迫在眉睫。可变数据印刷时代必须开启。因为只有可变数据印刷和普及才能满足出版产业发展的需求,否则,依靠油墨、纸张、体力劳动存活印刷厂必将在这个媒介最广泛的时代被淘汰。

  四、UIP应用生态构建

  UIP以其独特的编码识别方案为出版物唯一识别做到了类似于DNA的鉴别,是一种出版物个体识别标准。但任何一种标准不是孤立存在且能单独发挥其作用的,其必须依托一个良好的生态构建,才能发挥其最大的功效。因此UIP倡导的是生态,不单是倡导技术。

  建设出版生态所涉及的部门和群体是庞大的,比如涉及出版单位(图书出版、音像出版、互联网出版、数字出版等单位)、辅助生产商(印厂、排版厂、设计单位、加工单位)、渠道商(地面门店、网络渠道、无线渠道)、用户群体(机构用户、自然人用户)、政府监管部门(宣传部、文化部等)。

  (一)依赖政策支持

  UIP在单个出版单位能较快的推广应用,但实施之后,会发现产业链上下游都不能很好的配合应用,原因在于只应用了技术,没有构建好技术应用的环境。这就需要监管部门从行业发展的高度出发,积极探索并发动产业链上的企业加入到该应用的生态中,出台相关的扶持政策、支持企业软硬件升级改造,鼓励所有出版单位无一缺失加入,形成大环境,再去调动外围适应这种改变。

  另外要从政策上加大对非法生产、盗版团队的打击力度和处罚力度,同时引导执法队伍科学执法,提高反盗版效果。

  (二)依赖技术平台支撑

  UIP应用必须借助于一个具有权威性、唯一性的公众服务平台才能够为众多出版企业、销售渠道商、最终用户所接受。因此,构建出版产业UIP服务大数据平台是必由之路。

  UIP服务平台一般应包括以下模块:选题申报模块、发码模块、码库模块、渠道模块、读者模块、统计分析模块、内容管理模块、查验模块等等。

  (三)依赖硬件软件支撑

  目前出版企业基本上都已经使用了ERP对生产流程进行管理,为了有效地推行出版物唯一识别码,必须对ERP系统做相应的技术改造,才能在企业生产流程中有效地使用UIP。技改包括:把以往入库、发货、退货时扫描国际编码(ISBN、ISSN、ISRC)的方式改为扫描UIP;入库时向UIP服务平台发送UIP有效码回告;调退货时向UIP服务平台发送UIP状态变更请求等等。

  传统的印刷企业采用的印刷设备只能印刷固定格式的国际编码,不能印刷可变数据格式的编码,因此印刷设备的技术改造必须和UIP编码标准、发码、回告等环节相关联。在保持现有设备不变的情况下,在传统印刷流水线的末端增加一台可变数据印刷设备即可。

  (四)依赖流程用户支撑

  出版产业大数据的价值从某种层面上是在对用户(读者)的阅读信息数据分析后产生的,缺少了用户行为数据的分析,大数据毫无价值。因此UIP应用流程中应涵盖用户交互的过程,可以扭转传统出版单位长期与用户(读者)事实上的“失联”,有效地将出版企业从“产品生产售卖服务”模式引导走向“知识服务”模式。

  通过科学的UIP编码设计和应用生态构建,加上监管部门的政策引导扶持,出版产业链所有机构和个人的齐心协力,一个良好的出版生态将呼之欲出,必将对中国出版产业健康、快速发展产生积极的推动作用,对繁荣国家文化事业产生深远的影响。

  注释

  ①课题组已发表学术论文《以出版产业大数据破解出版企业困局的问题研究》《出版物唯一标识符在高校出版管理中的应用》;已完成《馆配大数据分析系统》软件开发及软件著作权申请1份;已完成大数据分析报告1份。

  参考文献

  [1]刘颖丽.ISLI是如何诞生的?[N].中国新闻出版广电报,2016-09-22.

  [2]国际关联标识符编码标准(ISLIISO17316:2015).https://www.iso.org/obp/ui/#iso:std:iso:17316:ed-1:v1:en.

  [3]吴洁明,安秀敏.CNONIX应用指南.http://www.cnonixlab.com/post/show.do?post_id=12,2015-11-16.

  [4]中国出版物在线信息交换图书产品信息格式规范(GB/T30330-2013).北京:中国标准出版社,2014.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号