业内信息

如何对研究数据进行有效管理

2017-09-27 来源:中国新闻出版广电报

  □香港大学图书馆馆长 Peter Sidorko

  最近的文学作品和新闻围绕“大数据”展开了数据讨论。虽然研究机构和大学所产生的所有研究数据都被认为是极其重要的,但实际上并非所有的数据都那么重要。对于服务于研究型大学在内等主要研究机构的大数据,或其他大多数数字化或类似所有形式的研究数据,这些机构有责任对这些数据进行适当的处理。对于为何要发展研究数据并且相关研究机构包括大学和捐款基金机构为何要更加重视对研究数据的管理,具体原因分析如下:

  1.研究成果的增长

  大学教职人员为实现终身任期,直接影响到越来越多的学术期刊:商业、开放获取和混合版本的出版。当前出版选项如此丰富,足以满足教职人员特别是研究人员日益增长的需求。虽然并不是所有的期刊研究文章都需要创建研究数据,但毫无疑问,无论大小还是复杂性,绝大多数都会生成一些数据。

  2.竞争力的提升

  研究成果的增长与竞争力提升这一概念密不可分。研究数据的增长主要归因于两个方面。首先,研究机构和资金机构越来越倾向于对研究方面的合作进行资助,这就保持了研究人员的强竞争力。这样的竞争力又推动了研究。这代表了积极的竞争,推动研究的同时进一步有利于社会的进步。其次,可能是恶性的,甚至是残酷的。对数据操纵、制作和伪造的指控确实存在。这种指责可能会导致职业生涯的破坏并破坏机构声誉。那些有助于研究机构支持或消除这种指控的研究数据应该保留,以便在某些特殊情况下迅速验证研究并解决问题。

  3.数据保留的完整性

  与上述竞争力的第二方面密切相关的是数据的完整性问题。数据的完好保存是未来验证当前研究成果的基础。然而,为了确保数据的完整性,假设最初为存储提交的内容具有这种完整性,则必须按照预期的方式存档、保留,并保证在未来的可使用性。

  4.复用性和共享性

  尽管在不同学科之间互有差异,研究性质也各有不同,但研究成本一般都很高。因此,研究数据的共享便十分重要且具有明显价值。一位研究人员生成的数据,对另一位研究人员来说也许是有用的。所以,资助机构和研究机构对研究人员施予越来越大的压力,促使其他人也能够访问他们的研究数据,无论是在全球范围内,不同国家、不同地域范围内、体制内,抑或研究人员自己所在的院系或部门内都能够实现共享。

  5.商业利益的影响

  如上所述,研究成本高昂,通过共享相关数据可以获得更高的效率,节省时间和资源,以重新创建研究成果。在国家层面,这种分享的好处有助于推动研究和创造巨大的商业利益。据澳大利亚国家数据服务局(ANDS)2014年研究发现,对于公共资助的研究数据,其全面可利用的潜在价值每年可达550亿美元。

  通过最近在香港大学的一项调查发现,我们的教师绝大多数将他们的研究数据存储在自己的电脑上。这种存储存在许多局限,包括由于硬盘驱动器损坏而导致数据丢失的潜在危机,升级计算机时丢失数据,未来的复用性方面得不到确保,以及数据保存缺乏可见性、共享性。在调查中,我们也了解到,我们绝大多数的教师也都认为图书馆应该在存储研究数据方面发挥必要作用。随后,香港大学制定了《研究数据和记录管理政策》。虽然学者库已经被用作最新研究信息系统(CRIS)好几年了,但是关于其是否是数据集功能性和经济性的最佳平台还存在一些疑问。在考虑了一些替代平台后,最终认同学者库具有存储和保留研究数据的功能,同时也是最经济的选择,也是实现最快的选择。这也被认为是理想的解决方案。为此我们已投入大量的技术、财务和人力资源来发展学者库,使之成为目前可用的研究信息系统。预计这是一个可以全面跟踪或尽可能全面的工具,能配合教师的研究周期,在小范围内也能够配合研究生的需求。

  近年来最新研究信息系统的发展非常重要,研究机构和资助机构也要求更高的问责制和效率。最新研究信息系统的数字空间建设已经开始开发,以更好地适应和记录所有形式的研究成果。这些系统数量的增长和普及程度的提高都是可以预见的。考虑到前述的研究数据日益增长的5个原因,我们对数据本身,以及适当的保留和维护研究周期等其他要素以便日后获得等,都有明确的需求。

















国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号