【摘 要】[目的]分析数字对象唯一标识符(DOI)后缀的组成特征,分析不同的DOI编码组成方式的优,缺点。[方法]选择Springer,Wiley和Elsevier出版社所属期刊和中华医学会杂志社旗下期刊为样本,分析不同出版社出版的科技论文的DOI编码组成特点。[查询查询结果]国外期刊论文DOI编码后缀多为期刊的ISSN,出版年,期,论文流水号或在刊名后接出版的年,期,论文流水号,DOI后缀中含有期刊名称缩写,具有指向的突出性; 2020年3月以前的中华医学会系列杂志论文DOI后缀多为期刊的ISSN,出版年,期,论文流水号,2020年3月以后,其DOI后缀更改为稿号,在DOI编码中仅能识别出期刊的CN号和投稿日期,其优点是可以满足在编排规范一致的情况下,网上优先发表的论文与纸刊论文具有相同的DOI,从而加快论文的数字化传播速度。[结论]目前,DOI后缀组成无统一标准,我国各出版单位应联合制定统一标准,增强DOI的标识性,易读性,制定适合一年级国情的DOI后缀组成方式。
【关键词】土井;后缀;期刊;优先出版
1998年,美国出版商协会建立了非营利机构国际数字对象唯一标识符(Digital Object Identifier,DOI)基金会,并创建了DOI系统,2010年11月,DOI系统被正式批准为ISO国际标准。年初,中国科学技术信息研究所和北京万方数据股份有限公司联合申请并取得了中文领域的DOI注册与管理权,成为DOI基金会授权的中国DOI注册机构,并于2007年7月开始正式运行中文DOI服务。无论在任何地方,用户都能够通过DOI编码链接到文献的原始出处,不会因网络地址变化而链接不到原始文献[1]。官方政策对期刊论文执行DOI编码,截止2020年3月3日,初始DOI注册数量达32536316条,期刊DOI注册数量为29630351条[2],据DOI基金会的统计结果,中文DOI的注册数量已居全球第2位[2] 。2007— 2019年,中文DOI注册数量如图1所示。中华医学会杂志社出版发行144种纸质期刊和43种电子医学期刊[3-4]。 2009年开始,中华医学会要求其系列杂志在文献的显着要位置注明文献DOI。2015年3月,为了保证研究的时效性,中华医学会杂志社要求其系列杂志DOI后缀具有唯一性,但后缀组成方式无统一标准,因此各出版单位期刊文献DOI后缀编码组成也就有所不同。国外期刊出版历史悠久,对DOI的使用历史回顾,DOI使用较成熟。本文通过分析比较国内外期刊的DOI编码规范,进行中文DOI后缀标注的最佳构成规则,为优化中文DOI后缀编码提供建议。

图1 2007 — 2019年中文DOI注册数量
1 个DOI编码组成
DOI编码由预设与后缀两部分组成,并与后缀之间用斜线号“ /”分开(图2)。由由目录代码和登记机构代码组成,目前,全球所有DOI的目录代码替换为“ 10” 。,登记机构代码为4位及以上阿拉伯数字组成,如中华医学会杂志社代码为3760,Elsevier出版社代码为1016,当4位阿拉伯数字代码分配完后,机构代码可以变成5位数字,以这类推用。DOI后缀的语法构成目前无统一标准,由出版机构自行分配,自行分配的原则为:必须保证在同一对准范围内的每一个后缀具有唯一性。指南》中推荐的DOI后缀编码构成方式为3种(表1),出版机构也可根据自身情况灵活处理,替代编排。

图2 DOI的组成
表1 推荐的期刊DOI着录格式
DOI编码样式 | DOI后缀注释 |
10.3772 / j.issn.1673-2286.2009.12.002 | 内容类别后接期刊的ISSN,出版年,期,流水号 |
10.3870 / YXYSH.2008.07.001 | 刊名预期后接出版的年,期,流水号 |
10.3969 / mpb.007.000028 | 刊名预期后接卷号与页码 |
2 国外出版社期刊论文DOI的组成和特征
2.1 国外出版社所属的期刊论文DOI构成
在国外的Springer,Wiley和Elsevier出版社分别选择一种期刊,通过分析期刊文献DOI的组成,发现DOI后缀多为论文流水号(表2),这与DOI推荐的后缀编码组成方式一致。论文的流水号是论文的录用序号或发表见刊的序号,如10.1111 / jgh.14606中,14606为论文录用的序号,这是因为在PubMed上查阅此DOI号的过程中,改变流水号时,发现14606前后的论文并没有与该论文在同一时期上发表,因此14606为论文录用流水号;有些DOI后缀饰流通水号则直接为论文发表的年卷期号+录用序号,如2020年2月第2篇录用的文章,流水号为20200202;有些是期刊出版论文的序号,如10.1016 / j.cell.2020.03.019,论文为2020年3月份出版期刊的第19篇论文。通过分析DOI后缀的内容可以知道,Springer,Wiley和Elsevier出版的期刊,DOI后缀中包含ISSN号或期刊名称缩写,后接论文流水号。
表2 国外出版社期刊DOI标注形式模仿分析
期刊名称 | 出版社 | 土井 |
癌症研究与临床肿瘤学杂志 | 施普林格出版社 | 10.1007 / s00432-019-02878-3 |
胃肠病学和肝病学 | 威利出版社 | 10.1111 / jgh.14606 |
细胞 | 爱思唯尔出版社 | 10.1016 / j.cell.2020.03.019 |
2.2 国外出版社所属的期刊DOI组成特征
Springer所属期刊论文的DOI后缀中包含期刊的ISSN号,论文发表年份和论文流水号,如10.1007 / s00432-019-02878-3,s00432为期刊ISSN号,019代表出版年份为2019年,02878- Wiley附属出版期刊论文的DOI后缀包含期刊名称的缩写和论文流水号,此样式的DOI可以使读者迅速获得论文刊登期刊的名称,如10.1111 / jgh.14606中jgh为J Gastroenterol Hepatol。 Elsevier出版社所属期刊论文的DOI后缀中则包含论文出版的年,期刊出版的期号和接续文件流水号,此样式的DOI可以使读者获得论文的论文出年份,通过进行复制。时间判断论文的时效性,如10.1016 / j.cell.2020.03.019中,j.cell代表期刊Cell,2020.03.019为出版年卷期和流水号。
3 中华医学会系列杂志论文DOI组成和特征
3.1 中华医学会杂志系列论文DOI组成
2020年3月以前,中华医学会杂志社所属医学期刊DOI后缀由期刊的ISSN,出版年,期,流水号组成。因DOI具有唯一性,如果期刊中某篇论文需网络优先发表时,因无法确定纸质期刊的刊出期号,此时,网络优先发表时DOI后缀中原来的期号要用00代替,当此篇优先发表论文在纸质期刊中刊登时,为保持DOI的统一,DOI 2020年3月起,中华医学会杂志社对所属系列期刊-后缀中的期号仍需与优先发表时保持一致,期号仍为00,但是此时会造成期刊中DOI着录格式不统一的问题。 DOI号标注的规则进行修订,DOI后缀由期刊CN号和稿号组成。稿号成为期刊文献的唯一标识,可以避免提前发表时无法确定期刊DOI中号的问题。
3.2 中华医学会杂志社附属期刊论文DOI着录特征
中华医学会杂志社所属的140多篇期刊DOI后缀的组成由ISSN号更改为CN号,原来是“出版年+出版月份+这一期所出版论文的序号”更改为稿号。的DOI中仅有能获得论文的收据日期,无法发现论文出版的年份,月份,以及它是这一时期的第几篇文章,但可以保证网上优先发表的论文与纸版论文具有相同的DOI ,以保证论文的时效性(表3)。以前的“出版年+出版月份+这一期所出版论文的序号”的著录方式,通过论文著录序号可识别本期共出版论文的数量,因为最后DOI后缀着录格式改变后,作者可根据稿号中的收稿日期与论文发表日期发表期刊的论文期,论文刊期对保证论文的时效性有重要的意义。
表3 中华医学会系列杂志的DOI标注形式
土井 | 期刊名称 | 年期 | DOI标注号 |
更改前 | 中华流行病学杂志 | 2020年1期 | 10.3760 / cma.j.issn.0254-6450.2020.01.006 |
中华预防医学杂志 | 2019年12期 | 10.3760 / cma.j.issn.0253-9624.2019.12.010 | |
中华肿瘤杂志 | 2020年1期 | 10.3760 / cma.j.issn.0253-3766.2020.01.001 | |
更改后 | 中华肿瘤杂志 | 2020年4期 | 10.3760 / cma.j.cn112152-20200120-00049 |
中华病理杂志 | 2020年6期 | 10.3760 / cma.j.cn112151-20190821-00459 | |
中华儿科杂志 | 2020年5期 | 10.3760 / cma.j.cn112140-20191018-00658 |
3.3 国内其他出版社期刊DOI后缀组成特征
通过查阅中华预防医学会系列期刊,中国抗癌协会系列期刊等文献的DOI,发现其DOI的后缀着录入全部为期刊的ISSN,出版年,期,论文流水号。万方数据库中期刊论文DOI的组成为期刊ISSN号后接期刊出版年代,期号,论文流水号;中国知网数据库平台为数据库中的论文分配了唯一的DOI,DOI的同样以10.开头,后缀内容中增加了CNKI字样,如DOI:10.13315 / j.cnki.cjcep.2020.04.004,当通过中文DOI网站转换解析时,解析结果有时提示DOI号码不存在,这是因为DOI未注册或未注册成功,所以中文DOI网站中中国知网期刊论文的DOI后缀编码由期刊名称简称或ISSN号构成,后缀由期刊发表的年,月,刊期及论文流水号构成,包含CNKI字样的DOI为中国。知网编排的DOI,识别度较高。
4 DOI解析结果
4.1 PubMed数据库DOI解析结果
4.1.1 国外期刊
在PubMed数据库中,通过检索DOI,可直接重定向至论文链接,如在PubMed检索框内部输入10.1007 / s00432-019-02878-3,检索后重定向至图3所示的界面,通过DOI查询结果可知,此文献的出版公司为Springer,通过链接可以在网页阅读文章全文。然后,DOI实现了它的本质意义,链接到论文的元数据。

图3 国外期刊论文DOI(10.1007 / s00432-019-02878-3)解析结果
4.1.2 中华医学会系列杂志
期刊被PubMed数据库收录,在PubMed上检索论文DOI同样可以得到DOI的期刊链接,如在PubMed数据库检索10.3760 / cma.j.issn.0253-3766.2020.01.001,同样可以得到此文献的出版公司为中华医学会杂志社,通过链接可以迁移至《中华肿瘤杂志》官网(图4)。

图4 PubMed数据库检索DOI:10.3760 / cma.j.issn.0253-3766.2020.01.001的结果
4.2 中文DOI注册与服务中心解析结果
通过中文DOI注册与服务中心(http://www.chinadoi.cn/portal/index.htm)解析中华医学会系列杂志DOI,可以进行论文出处,有些解析地址是相关期刊官网,如对《中华肿瘤》 DOI:10.3760 / cma.j.issn.0253-3766.2020.01.001进行解析,得到图5所示的解析地址;某些期刊的DOI解析后无法替换至相关期刊网站,解析地址可能是万方数据库或者中国知网数据库,如对DOI:10.3760 / cma.j.issn.0529-5807.2019.08.001通过中文DOI网站进行解析,如查询查询结果图产品6所示,并未能跳转至相关期刊官网,而是显示了一系列万方数据库的两个链接,读者可以选择某个链接查看论文。

图5 中文DOI注册与服务中心对DOI:10.3760 / cma.j.issn.0253-3766.2020.01.001的解析结果

图6 中文DOI注册与服务中心对DOI:10.3760 / cma.j.issn.0529-5807.2019.08.001进行解析的结果
5 统一DOI后缀组成的意义
Elsevier,Wiley和Springer等国外著名出版公司采用DOI来标注各种类型的内容,将其广泛出版的图书,期刊,学位论文,会议论文,医学案例和视频资料等[ 5 ]。到发表,稿号不会改变,受此启发,有学者研究将具有唯一性的稿号日期到DOI后缀格式中,这样可以更好地解决文章优先于纸质期刊发表时流水号不能确定的问题[ 6 ]。中华医学突破之前的DOI后缀更改为稿号,也是为了解决提前发表的期刊文献可以与纸质版期刊文献保持一致的DOI。
5.1 保持DOI后缀的结构化
通过DOI结构能够预测出一些有关论文出版的年,期等信息。DOI标识系统的唯一性决定了期刊数字化资源的唯一性[7]。通过信息技术的发展,出版方式变得更为灵活,便捷,学术知识传播更加及时,优先网络或电子出版也将成为主要出版形式,可进一步扩大出版周期[8]。DOI的主要作用就是为文章出版机构的内容持久持久的链接,结构化的DOI有助于增强DOI的使用性。
5.2 保持唯一性,提高标识性,易读性
DOI既能提供让人们很容易检索的标识码,也可以防止出版物被轻而易举地非法复制盗版,保护出版者的知识产权[9]。标注了DOI的期刊文献,其优先数字出版的文献资源可以快速传播,快速检索,也可以实现资源共享,提升期刊的国际影响力[10]。目前,各地各出版社或出版集团对于所属期刊DOI后缀组成与国外一样无统一标准,但DOI在不断优化过程中,提高识别度和易读性,增强扩大DOI的使用范围,提高读者对DOI的利用,增加更多论文的检索与引用。
5.3 提高DOI的可用性
当读者需要查询某篇文章时,可在数据库内部输入译文关键字,通常会检索出多条相似结果的文献,还需要再增加检索才能找到特定的文章,有时候还可能遇到该文章不在所搜索的数据库内部,但使用DOI检索某篇文章特定文献的时候,可以直接检索到文章的全文链接。总而言之,期刊期刊DOI的使用仍在不断扩展,信息与新闻出版学期刊中已经正常使用和标注DOI的期刊只占50%[11]。DOI指南手册虽已明确拒绝不要假设DOI编码,但是有规律的DOI编码能够帮助读者更容易查询到纸元数据。因此,DOI编码的构成并不应该考虑到唯一性,结构化,持久性,更应该增加DOI的可用性和易读性。当读者看到某篇文章的读者的文章时,通过搜索引擎搜索时可能出现很多相似文献,无法快速定位到相应的论文,而通过DOI解析,可以直接准确地获得相应的论文,然后,DOI的可用性就给作者提供了便捷,从而提高了论文的传播和引用。
6 结束语
通过分析比较发现,各期刊出版商对于DOI有其自身的特征规定,必须保持统一标准,各种DOI后缀拥有自身的特征,如何选择或规定DOI后缀,还是要依据出版社的要求侧重于此方面来决定编码方式。如果出版的期刊多数以优先网络发表为主,选择论文稿号或录用流水号均可以;如果侧重于纸刊发表,可以以“出版年月+论文流水号”为主。
中文DOI应以本土化的服务为中文数字资源提供符合国际标准规范的全球唯一标识,同时,中文DOI的构成也需要有自身的特色,同时推动建设基于DOI的,开放式的资源链接系统,从而促进数字内容产业上下游各行业的联合与共赢。
目前,没有任何DOI后缀构成方式可以涵盖所有的优点,根据出版社的要求制定编码策略,期刊人应结合自身情况,努力找到一个兼顾优先出版和传统出版的编码方式,DOI编码不足为暗码,不提倡推测,但是在不断发展的过程中,给读者提供更多信息,是DOI在新时代背景的新任务,也是给DOI的使用添加新的功能。若DOI被广泛着录,其也可以成为传播期刊影响的一个新指标,使广大读者更深入地了解DOI,从而推动DOI的普及。
参考文献
[1]中文DOI注册与服务中心.期刊启用DOI通知范例[EB/OL].[2020-05-29].http://www.chinadoi.cn/portal/newsAction!detail.action?id=108.
[2]中文DOI注册与服务中心.中文DOI注册统计[EB/OL].[2020-05-29].http://www.chinadoi.cn/portal/Doisum.htm.
[3]中华医学会.中华医学会简介[EB/OL].[2020-05-29].https://www.cma.org.cn/col/col2/index.html.
[4]中华医学会.电子期刊[EB/OL].[2020-05-29].https://www.cma.org.cn/col/col522/index.html?uid=325&pageNum=1.
[5]ParkS,ZoH,CiganekAP等.关键词:数字物体识别系统,检验成功因素电子商务研究与应用,2011,10(6):626-636.
[6]原源,戴豪泽.科技期刊数字优先出版问题与应对[J].编辑学报,2016,28(3):279-281.
[7]赵继海,周文芳.DOI系统的发展及其对数字图书馆的影响[J].图书情报工作,2004,48(4):90-93.
[8]戴豪泽.优化DOI后缀格式,适应优先数字出版[J].传播与版权,2019(1):58-60.
[9]王海英,龚永红,张金艳.DOI:数字对象标识技术[J].情报杂志,2004,23(12):91-92,95.
[10]王雪萍.优先数字出版的科技论文DOI标注分析[J].编辑学报,2014,26(6):541-544.
[11]湛江,朱宝林.期刊DOI的标注和解析情况研究-以信息与新闻出版学期刊为例[J].情报学报.今传媒,2016,24(12):110-111.