共享和开放访问公共资助的科研数据或许更能释放科研数据的潜能

摘要
开放存取是不同于传统学术传播的一种全新机制,也是必然趋势。共享和开放访问公共资助的科研数据或许更能释放科研数据的潜能。

注:图片来源于必应

“开放”意味着任何人都可以出于任何目的自由访问,使用,修改和共享,最多遵循保留来源和开放性的要求[1]。开放科学是一种颠覆性现象,开放科研数据作为开放科学的一部分,助力开放科学的发展。开放科研数据(Open Research Data)与开放数据(Open Data)不同,后者主要基于开放政府倡议的背景下,而忽略了科学上的特殊需求[2]。
科研数据管理的FAIR原则包括可查找(findability),可访问(accessibility), 可理解(interoperability), 可重用(reusability)[3]。共享和开放访问公共资助的科研数据,一方面有助于最大程度地释放科研数据的潜能,另一方面也可以从公共研究投资中获得更大的回报。

注:图片来源于必应

科研数据在当今的信息社会中起到关键作用。尽管已经发布的数据的数量持续增长,但是在发布数据方面仍然需要进行大量的工作,以便能够使研究数据被发现、使用以及供他人重复使用。但是由于存在一些阻碍影响了数据发布,例如缺乏学术奖励、模糊的引文做法等问题[4]。
该赞扬的就要赞扬(credit where credit is due),在这种背景下,数据出版作为一种新的数据共享模式出现,它用一种人类可读的结构描述数据,为学术界提供了一种具有公信力的出版物[5]。数据出版的核心是为数据引用提供标准的引用格式和永久访问地址,使科研数据是可获取、可理解、可评估、可使用的。总体上,数据出版模式可分为三类:
  • 独立的数据出版,即在数据存储库存储发布(不依赖出版物的数据发布)
  • 作为论文辅助资料的数据发布(附属于出版物的数据发布)
  • 以数据论文形式发布(作为出版物本身的数据出版)[6]。

注:图片来源于必应
 
将数据作为正式的科研成果,像同行评议的论文一样出版,这是承认科研人员努力的有效方法之一。正确的数据引用能增加对数据生产者和数据中心的认可度,也是保护数据创建者知识产权的重要途径之一[7]。
什么是数据论文?

数据论文是指期刊出版有关数据集的描述性文章即数据论文,其主要目的是数据描述[8],发表的是可被检索的元数据文件,用以描述单个或一组可在线访问的数据集,其内容主要是对数据采集、获取、处理等过程和方法的描述,不涉及对数据和研究结果的推论、发现以及假设论证,经过同行评议,目的是让科研群体更好地发现、获取、理解、复用数据,并再次进行科研创新[4]。

什么是数据期刊 ?
数据期刊是将数据转化为论文的形式进行描述,发表在数据期刊中,通常与领域内的数据中心或公共数据仓储联合实现数据集的存缴,数据论文的出版具有和学术论文相似的同行评议评审流程。数据期刊指那些致力于发表数据论文的期刊,其重在描述实验和观察数据,并有效整合传统学术论文的内容和结构,力求在最大程度上促进数据重用,帮助用户进行检索和数据挖掘。数据期刊大致分为2种:
  • 一种是混合性数据期刊,出版数据论文的同时,也出版综述、研究论文、会议报告等类型的文章;
  • 另一种是纯粹数据期刊,其出版单元全部为数据论文。

 

数据期刊的主要优势之一是它们专注于开放科研数据,鼓励重复使用,因为它们描述了获取和分析数据的方法。相比之下,在许多常规文章中,减少了数据收集的描述,以突出显示结果及其讨论[8]。

代表性数据期刊
 
Scientific Data是采用同行评审的开放获取期刊,主要发表具有科学价值的数据集的描述,不受篇幅及科学领域的限制。其使命是帮助科学家发表、发现丰富的研究数据,并实现数据的再利用。Scientific Data发表论文的主要类型为Data Descriptor。该刊筛选论文的六个关键原则是信用、重用、质量、发现、开放和服务,旨在帮助帮助科研人员发现、解释和重用研究数据,促进科研数据的共享和重复使用[9]。

注:图片来源于必应
《中国科学数据》(China Scientific Data)是目前中国唯一的专门面向多学科领域科学数据出版的学术期刊,致力于科学数据的开放、共享和引用,推进科学数据的长期保存与数据资产管理,探索科学数据工作的有效评价机制,推动数据科学的发展,重点关注生命科学与医学、地球系统科学、空间科学与天文学、物理学、化学化工、材料科学与工程、信息科学、社会科学等领域的基础数据及数据产品[10]。
要在科学上取得进步,我们需要开放和分享。
参考文献

 

[1] The Open Definition (2017). The Open Definition. Retrieved from http://opendefinition.org/.
[2] Pampel, H., & Dallmeier-Tiessen, S. (2014). Open research data: From vision to practice. In Opening science (pp. 213-224). Springer, Cham.
[3] Research Data: Turning FAIR Into Reality(2018). Retrieved from https://www.infodocket.com/2018/11/24/research-data-turning-fair-into-reality-report-of-the-commission-fair-data-expert-group/
[4] Candela, L., Castelli, D., Manghi, P., & Tani, A. (2015). Data journals: A survey. Journal of the Association for Information Science and Technology, 66(9), 1747-1762.
[5] Chavan, V. & Penev, L.  (2011). The data paper: a mechanism to incentivize data publishing in biodiversity science. BMC Bioinformatics, 12 Suppl 15(Suppl 15), S2.
[6] 张晓林,沈志宏,刘峰(2014). 大数据时代的科研活动. 北京:科学出版社,149-158.
[7] 屈宝强, & 王凯(2016). 科学数据引用现状和研究进展. 情报理论与实践, 39(5).
[8] Schöpfel, J., Farace, D., Prost, H., & Zane, A. (2019, October). Data papers as a new form of knowledge organization in the field of research data. In Colloque ISKO France (Vol. 9, No. 11).
[9] Scientific Data. Retrieved from https://www.nature.com/sdata/about/principles.
[10] 中国科学数据. Retrieved from http://www.csdata.org/p/static/33/.
杂谈

科技进展:如果记忆可以再生,你会将它转移吗?

2019-12-20 14:04:34

杂谈

2019年中国医院/医学院校科技量值排行榜发布

2019-12-20 14:07:27

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索