![]() 业内信息“供给侧”视野中的我国商用文献数据库2016-11-22 来源:出版发行研究 王丰年
摘 要:由于我国文献数据库缺乏统一规划、赢利模式的恶性厮杀、数字技术壁垒等因素的影响,像中国知网、万方数据库、龙源期刊网、维普数据库等存在明显而严重的定位模糊、内容重复、检索程序雷同、利益模式单调,造成文献数据库严重产能过剩。商用文献数据库成为信息产业“供给侧”改革的突破点,需要从政府统筹制定数据库产业长远发展策略、建立合理的收费价格体系、设立数据库生产企业发展协会等角度,探讨改善商用文献数据库重复建设的对策。 关键词:文献数据库 商用文献数据库 产能过剩 供给侧 从国际文献数据库的发展现状分析,英国的Ingenta、德国的Springer-Verlag、荷兰的Elsevier、美国Wiley InterScience等不仅数字处理技术上不断创新,收录种类和内容越来越广泛,而且用户遍及世界各地。20世纪80年代,我国的文献数据库开始建设;90年代以后,中国知网、万方数据库、龙源期刊网、维普数据库进入商品化和产业化。目前,我国绝大多数文献数据库是商用,但也有学术期刊建立网站,开发具有自主版权的主页,配合纸质版的出版进行配套网络服务,例如,沈阳药科大学主办的网络版《中国药剂学杂志》、西北大学主办的网络版《西北大学学报》等单种期刊的网络版;也有开放存取(Open Access,简称OA)的公益性文献数据库,像国家社会科学基金特别委托中国社会科学院调查与数据信息中心承担项目——国家哲学社会科学学术期刊数据库。时至今日,我国文献数据库数量众多,无论政府管理机构,还是学术机构,无法统计全部商用文献数据库重复状况,并且也没有方法进行有效统计,“数据库的发展成为信息产业领域的‘供给侧’改革过程中一个绕不过去的问题”。[1]本文仅以国内商用广泛的文献数据库像万方数据库、龙源期刊网、中国知网、维普数据库为例,分析我国文献数据库“供给侧”的现状和其问题,提出相应的调整对策。 一、商用文献数据库“供给侧”的现状 从国际视野分析,德国的斯普林格(Springer-Verlag)、美国的IEL(IEEE/IEE Electronic Library)数据库在发展过程中也曾遇到技术、版权等困惑;而我国各商用文献数据库除了尚未有效地解决技术、版权等问题,在定位、内容上存在严重而明显的产能过剩。 1. 定位模糊 中国知网、万方数据库、维普数据库等在数字化、数字出版的模糊定位下,各自都推出了大同小异的期刊学术论文、学位论文、会议论文,而这些论文在不同商用文献数据库之间存在很高的重复收录。 2. 内容重复 中国知网、万方数据库、龙源期刊网、维普数据库在内容上都力求收录齐全,覆盖人文、社会科学、自然科学各学科领域,但是,在内容重合的同时,更为遗憾的是遗漏了许多有学术价值的学术文献。 3. 检索程序雷同 中国知网、万方数据库、龙源期刊网、维普数据库都通过关键词检索、机构检索、全文检索、年检索、中文摘要检索、中文刊名检索、期检索方式,进行检索范围的限定,检索程序相似。在学术不端的论文抄袭检测上,中国知网设定了阈值为5%的检测系统灵敏度,以文章的段落为单位,检测系统会忽略低于5%的抄袭、引用。即使同一篇论文在不同文献数据库中的内容重复检测结果相差无几,其检测原理、检测程序相似。 4. 赢利模式单调 中国知网、万方数据库、龙源期刊网、维普数据库都通过中心网站、光盘、IP地址识别、镜像等方式,向用户提供可包库订购或购卡使用,有些用户还可获得免费的文摘信息、题录,绝大多数用户付费获得全文。 二、商用文献数据库“供给侧”过剩的原因 中国知网、万方数据库、龙源期刊网、维普数据库等商用文献数据库呈现百花齐放的同时,由于缺乏统一规划、数字技术壁垒等因素的影响,造成文献数据库低技术含量、低性价比的重复。 1. 缺乏统一规划 中国知网、万方数据库、龙源期刊网、维普数据库是当前国内使用最广泛的文献数据库,但在内容、使用方式、赢利模式、技术开发等关键环节上,各自为政,甚至存在技术壁垒,造成重复原始纸版期刊文献收集、技术水平相似的重复开发。 2. 赢利模式上的霸王条款 虽然各个商用文献数据库不断推出包月、团体购买等花样翻新的促销方式,像维普数据库和中国知网既提供会员注册基本服务,又包含网卡售卖功能;但不仅仅个人用户,即使有些大学、科研机构也无法应对飙升的数据库收费。2014年,因中国知网的报价从原来的40万元提高至70万元,云南大学图书馆不得已暂时停用了中国知网。[2]因涨价过高,2016年3月31日,北京大学官网上贴出中国知网可能停用的通知。[3]虽然上述高校已筹集经费,恢复使用中国知网,但一场场涨价闹剧无异于菜市场的讨价还价。 作为内容供应商,商用文献数据库通过对收录的纸版文献进行重新分类、二次汇编,向科研院所、高校、机关、企业、个人提供有偿服务,而正是有偿服务的“度”存在不合理而遭到质疑。从经济学理论上分析,一般商品的边际成本随着产量的增加而上升,而信息产品的固定成本要比边际成本高得多,“信息产品一旦生产出来,再生产的成本就非常低”,[4]因此,无论是从经济学理论还是从用户的具体使用上,商用文献数据库价格体系存在诸多不合理的条款。 3. 数字技术壁垒 2005年5月,国际标准化组织ISO规定PDF为国际上通用的文献数据库阅读、下载格式,因为PDF格式不仅支持XML,而且分层授权使用内容:全文可拷贝、部分可拷贝、可以打印、不能打印、只读等。因为我国尚未建立统一的文献数据库技术标准,各文献数据库往往使用不同的文件格式。 中国知网、万方数据库、龙源期刊网、维普数据库的阅读方式不同,各自采取保护自身利益的措施,无法整合学术资源的共享。例如,中国知网全文采用PDF和CAJ格式,维普数据库有PDF和VIP格式,万方数据库的“数字化期刊子系统”采用PDF和HTML格式。此外,我国文献数据库常见的格式还有CEB、DOC、TEB等,只有下载、安装不同的软件,读者才能阅读。 4. 知识产权的归属 商用文献数据库不是原始的出版者和作者,无疑应该遵守利用知识产权规范,但文献数据库存在使用纸版期刊文献不规范甚至盗版现象。各大商用文献数据库拥有海量的作者,如果逐一得到作者的直接授权,其程序相当繁琐,所以文献数据库、作者、纸版学术期刊之间的纠纷经常诉诸法庭。 三、商用文献数据库“供给侧”过剩的后果 通过文献数据库,用户可以从众多的文献中迅速、准确地查找符合研究需要的资料,成为获取知识的途径,但商用文献数据库的“供给侧”过剩带来了一系列后果。 1. 用户选择上无所适从 缺乏统一的管理机构、规范的制约,诸多商用文献数据库各自为政;而任何一个数据库又不可能收录所有文献。因为各种相似的文献数据库既重复,又有遗漏,所以用户很难做出购买决策。如果只购买一种,肯定会遗漏一些有学术价值的学术资源;而如果同时购买万方数据库、中国知网、维普数据库、龙源期刊网,虽然一定程度上减少了遗漏,但用户为重复的文献数据库付出了不必要的大量资金,而且浏览并剔除在不同文献数据库中的同一篇文章,要花费不必要的时间、精力。 2. 资金投入浪费 毋庸置疑,商用文献数据库的开发要投入大量的人力、物力和财力,而其重复建设则是叠加的浪费;应优化现有文献数据库,开发具有更高学术价值的学术资源。 3. 难以形成规模效应 从我国的数据库产业发展分析,数据库检索平台很难统一、无法实现高效的跨库检索和利用,而商用文献数据库的重复建设导致了同行业的恶性竞争,限制了各自的规模发展。 4. 难以提升质量 商用文献数据库更关注短期如何赢利,获取竞争优势;忽视了如何在更高技术含量上,实现文献数据库在更高技术水平、更便捷服务功能上的创新。 5. 制约着国际化的程度 国际文献数据库具有数据量大、更新速度快、检索结果的显示与输出灵活等优势,已经形成很大规模,走向产业化和商业化。我国众多商用文献数据库呈一片散沙似的蔓延,各自在谋求最大经济利益的同时,忽视了更高技术的技术开发,致使我国在全球数据库产业发展中徘徊不前。 四、商用文献数据库“供给侧”的调控 “供给侧结构性改革的目标是化解过剩产能,提升有效供给能力。”[5]文献数据库“供给侧”需要从政府统筹规划、建立非营利的收费价格体系、完善数据库知识产权保护法规等角度,去除商用文献数据库的过剩产能。 1. 加强政府统筹规划 国家新闻出版广电总局、科技部应该对中国知网、万方数据库、龙源期刊网、维普数据库等进行案例分析,扭转各自为政、重复开发、条块分割的恶性竞争,统筹布局文献数据库之间的分工和合作,制定文献数据库的产业政策,有效调控、整合文献数据库的“供给侧”问题;否则,不仅现有的商用文献数据库像中国知网实施自定的霸王条款乱收费,而且一旦更多商用文献数据库为了经济利益遍地开花,将背离其服务学术研究的功能而成为障碍。 2. 提高文献数据库的性价比 根据我国数据库产业发展政策和国家数据库管理机构的发展规划,商用文献数据库像维普数据库、万方数据库、中国知网、龙源期刊网等应该定期征求读者的意见,避免重复选题,不断开发出更高性价比的收录、下载、使用方式,提升自身的核心竞争力,避免各商用文献数据库之间的恶性竞争。 3. 建立非营利的收费价格体系 国际商用文献数据库对个人和单位采取不同的收费制度,个人用户收费低于机构。用户从不同的商用文献数据库下载同一篇文章,即使文章的字节、页面相同,会出现不同的价格。因此,既然商用文献数据库不是纯企业,在收回成本、获利颇丰的情况下,应建立商用文献数据库的非营利的价格体系,甚至朝公益性发展。 4. 设立数据库生产企业发展协会 在国家新闻出版广电总局、科技部、财政部等机关部门的协调下,中国知网、万方数据库、龙源期刊网、维普数据库等商用文献数据库应该成立文献数据库协会,定期召开数字技术、经营模式的创新、法律保护的年会、研讨会,加强商用文献数据库之间的交流,提升各自的技术,推出更具性价比的使用方式,减少同业间的恶性竞争。 5. 用户有针对性地选择文献数据库 有的学校图书馆、科研机构同时购买几个重复率很高的商用文献数据库,以不必要的自身消耗,不情愿地推动了商用文献数据库的重复建设,造成各个商用文献数据库之间的恶性竞争,甚至互相贬低。因此,图书馆、科研机构要充分调研自身的需求,按品种、类别等择优订购,以有限的资金获得更多有学术价值的数据资源。 6. 完善数据库知识产权保护法规 我国数字出版业存在4种版权授权模式:版权集体管理机构模式、法定许可模式、授权要约模式、超星模式,多数数字出版企业实施集体管理出版模式和超星模式。因为文献数据库不仅没有取得合法版权授权,又存在着作者重复授权问题,导致现有的授权模式并不能解决文献数据库的纠纷。其轻松获利的方式必然导致重复建设,加剧了文献数据库的“供给侧”问题。为了自身利益,有的作者甚至将同一文章同时授权若干数据库,导致商用文献数据库之间毫无创新的内容重复。 我国一些文献数据库诸如中国科技论文在线、中国学术会议在线、中国医学尝试欧美文献数据库的3种开放存取机制:版权部分转让、版权部分保留、版权归作者所有,但仅仅是尝试,而且开放存取可利用的学术资源范围有待于拓展。欧美非开放存取有两种方式:国家许可证制度(National License)和学术期刊仓储式(Warehouse Database),北欧国家像瑞典、冰岛、丹麦、挪威、芬兰等广为实施国家许可证制度,学术期刊仓储式在世界范围内接受程度比较高。国家许可证制度的运行逻辑是政府授权出版商,同第三方非营利信息服务机构——文献数据库,签订国家许可证,允许第三方非营利信息服务机构——文献数据库,在全国范围内使用前者的信息资源,同时,向公众免费提供检索、浏览、下载、接入、打印、复印。因为第三方非营利信息服务机构——文献数据库单方面承担版权责任,所以,消除了数据库、纸版学术期刊、作者之间的法律纠纷。从国家统筹管理的角度,国家许可证制度有效地建立了文献数据库、作者、用户、纸版刊物的平衡机制:通过转移支付,国家补偿作者和数据库开放存取,而通过修改担保条款,数据库以承担版权的法律纠纷。 2012年3月,全国哲学社会科学规划领导小组委托中国社会科学院调查与数据信息中心国家社会科学基金特别委托项目——建立国家哲学社会科学学术期刊数据库:用户只要经过简单的注册,即获得可免费使用信息检索、在线阅读、电子书查阅、论文全文下载和整本期刊下载等公益性服务。[6]用户通过国家补贴免费获取学术文献,是国家许可证制度在我国的有益尝试。 7. 建立文献数据库评价体制 虽然我国出版管理部门先后出台《报纸期刊出版质量综合评估办法》《全国报纸期刊出版质量综合评估指标体系》,但“从评价目的、评价主体、评价客体、评价标准及指标、评价方法和评价制度这六个方面看,有的规定已体现出这些特点,但有的内容则没有或不充分。”[7]不断推出的各种纸版学术期刊评价虽然花样翻新,但评价结果一地鸡毛,颇受质疑;文献数据库的评价应吸取纸版学术期刊评价的经验和教训,按照客观性、公正性、权威性原则,从区别不同学科制定不同评价标准、制定定量评价指标、组织专家的定性评价、引进西方学术评价方法等方面,[8]建立我国文献数据库评价体制。 8. 加强文献数据库建设的研究 “从整个信息系统的变革来看,从过去的以流程为中心,逐步向以数据为中心转变,相应的对数据管理技术、数据分析技术的要求也越来越高,将会催生更多的市场需求。”[9]从国际分析,在技术支持、使用便捷程度上,我国文献数据库有待提高;应该将重复、低水平开发的人力、物力和财力,投入文献数据库更高技术开发。以往对文献数据库的研究多数集中在收费体系、使用方式上,应该从学术评价、学术体制改革等方面,拓展文献数据库的研究领域。 “产能过剩、库存过大是无效和低端供给的集中表现。”[10]无论对商用文献数据库自身,还是对用户来说,“供给侧”问题不仅影响文献数据库的发展,而且增加了用户的不必要的负担,因此,国产数据库成为信息产业“供给侧”改革的突破点,公益性文献数据库和各个商用文献数据库应该尽快结成战略合作伙伴,在全球范围内推广中文的数字化资源。 参考文献 [1][9]孙博洋. 国产数据库成为信息产业“供给侧”改革的突破点[EB/OL].(2016-02-16). http://finance.people.com.cn/n1/2016/0216/c153179-28128035.html. [2]云南大学图书馆. 关于CNKI下载问题的公告[EB/OL].[2014-01-04]. http://www.lib.ynu.edu.cn/news/446. [3]叶雨婷. 北大因中国知网涨价暂停续订 一年涨幅最高超50%[N]. 中国青年报,2016-04-07. [4]童健. 浅析供给侧结构性改革与出版集团主业发展实践[J]. 科技与出版,2016(6):37. [5]胡鞍钢,周绍杰,任浩. 供给侧结构性改革——适应和引领中国经济新常态[J]. 清华大学学报,2016(2):19. [6]毛莉. 国家哲学社会科学学术期刊数据库上线运行[N]. 中国社会科学报,2013-07-17. [7]叶继元. 学术期刊质量评价具有多元性与复杂性[J]. 清华大学学报,2015(2):185. [8]王丰年. 论我国数字学术期刊的评价[J]. 出版发行研究,2015(7):61. [10]王一鸣,陈昌盛,李承健. 正确理解供给侧结构性改革[N]. 人民日报,2016-03-29. (作者单位:《清华大学学报》编辑部) * 本文系清华大学亚洲研究中心2015年度一般项目“我国商用文献数据库的困境和对策”的研究成果之一。 |
国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周
copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持