数据共享政策
  • 一、什么是论文关联数据
    二、论文关联数据的类型及共享方式
    三、论文关联数据的提交格式
    四、数据使用许可协议
    五、数据共享方式
    六、数据可用性声明
    七、数据的引用
    八、案例
    九、咨询与帮助



    科学数据是国家科技创新的基础性和战略性资源,是科学研究中必不可少的基本要素。为贯彻执行中国科学院加强和规范论文关联数据的管理的通知精神,确保论文关联数据保存准确、完整、及时,可查询、可追溯,可开放共享,本刊建议作者及时将发表论文的关联数据提交相关数据存储库并共享。具体事项如下:


    一、什么是论文关联数据

    论文关联数据是指通过基础研究、应用研究、实验开放等产生的用于支撑学术论文发表的数据,以及通过观测检测、考察调查、检验检测等方法取得并用于形成论文图表、支撑论文研究结论的原始数据及其衍生数据。论文关联数据(调查或实验数据资料)是论文研究成果和结论的重要佐证。论文关联数据的共享不但可以提升研究的可验证性和透明度,数据的重复使用还可以有效地提高数据资料的利用效率,节省人力物力,对中国植物生态学研究具有重大意义。论文数据作为一种新型学术成果,将促进学科领域间的创新合作。


    二、论文关联数据的类型及共享方式

    用于直接支撑论文结论的数据应该共享。

    为开展论文课题研究而产生的且反映在论文中的数据,或为开展论文课题研究而进行重复使用或分析的数据鼓励共享。

    为开展论文课题研究从实验或观察中得到的原始的、未加工的且未反映在论文中的数据自愿共享。

    涉及保密信息、科研伦理、敏感信息或共享数据将损害第三方合法权益等情况的数据不宜共享。


    三、论文关联数据的提交格式

    论文关联数据的共享不限制作者提交的数据格式。但从数据可重用、可长期访问等方面考虑,请作者优先参考推荐格式列表。此外,本刊亦提供数据文件的非首选格式参考列表。

    若所选数据文件格式尚不在下表中,本刊推荐作者从以下三个方面自行评估数据文件的可重用和长期可持续访问情况:(1)采用的文件格式是领域内的常用格式;(2)采用的文件格式有开放的规范或标准;(3)采用的文件格式独立于特定的软件、开发人员或供应商。若无法完全符合上述要求,也请尽可能满足以上三点原则。

    文件类型

    推荐格式

    非首选格式推荐

    纯文本文件

    Unicode text (.txt)

    Non-Unicode text (.txt)

    标签语言文件

    XML (.xml)
    HTML (.html)
    Related files: .css, .xslt, .js, .es

    SGML (.sgml)

    文本文档

    PDF/A (.pdf)

    ODT (.odt)
    MS Word Microsoft Word (.doc, .docx)
    Rich Text File (.rtf)
    PDF (.pdf)

    RDF

    RDF/XML (.rdf)
    Trig (.trig)
    Turtle (.ttl)
    NTriple (.nt)
    JSON-LD

    电子数据表

    CSV(.csv) ODS(.ods)

    MS Excel (.xls, .xlsx)
    PDF/A (.pdf)
    OOXML (.doc, .docx)

    数据库文件

    SQL (.sql)
    SIARD (.siard)
    DB tables (.csv)

    MS Access (.mdb, .accdb) (v.2000 or later)
    dBase (.dbf v.7 or later)
    HDF5 (.hdf5, .he5, .h5)

    统计数据

    SPSS Portable (.por)
    STATA (.dta)
    DDI (.xml)
    Data and setup (.csv +.txt)
    R

    SPSS (.sav)
    SAS (.7dat, .sd2, .tpt)

    光栅图片

    JPEG (.jpg, .jpeg)
    TIFF (.tif, .tiff)
    PNG (.png)
    JPEG 2000 (.jp2)
    DICOM (.dcm)

    矢量图片

    SVG (.svg)

    Adobe Illustrator (.ai)
    EPS (.eps)
    CDR (.cdr)
    WMF/EMF (.wmf, .emf)

    音频文件

    BWF (.bwf)
    MXF (.mxf)
    Matroska (.mka)
    FLAC (.flac)

    WAVE (.wav)
    MP3 (.mp3)
    AAC (.aac, .m4a)
    AIFF (.aif, .aiff)
    OGG(.ogg)


    四、数据使用许可协议

    作者可选择的数据使用许可协议有以下八种国际通用许可协议:CC0、CC-BY 4.0、CC BY-SA 4.0、CC BY-NC 4.0、CC BY-NC-SA 4.0、CC BY-ND 4.0、CC BY-NC-ND 4.0(以上协议的开放程度依次递减)和ODbL(用于数据库类型的数据)。数据使用者须根据作者选择的数据使用许可协议对数据进行使用。

    为了更好地传播和共享论文关联数据,本刊推荐作者使用CC-BY 4.0许可协议


    五、数据共享方式

    数据共享的方式有直接共享和有条件共享两种方式,作者可以根据自己的实际情况选择适合的方式。

    (一) 直接共享

    作者提交的论文关联数据,一旦通过评审,将被即时发布。发布后即向公众公开提供元数据、数据文件的访问获取。

    (二) 有条件共享

    1.   数据保护期后获取

    作者提交的论文关联数据可设置保护期。保护期内,公众仅能访问数据的元数据,而无法下载获取数据文件。保护期后,数据自动转为开放获取状态,公众皆可访问获取其元数据和数据文件。

    2.   依申请获取

    作者提交的论文关联数据因特殊原因不宜开放共享,数据使用者须向作者提出数据访问申请,得到作者授权或同意后,才能获取数据文件。

    (三) 选择数据存储库

    本刊论文关联数据可以在本刊网站或数据存储库中提交并共享。本刊对数据存储库的遴选标准和推荐列表如下:

    1. 遴选标准:数据存储库应遵循FAIR共享原则,保障科学数据的可发现性、可访问性、互操作性和可重用性。具体包括以下内容和要求:

    (1)数据存储库应为科学数据提供可发现的数据标识;

    (2)数据存储到存储库,应提供可供编辑部、审稿人审核使用的链接和公开共享的永久访问地址;

    (3)数据元数据和文件应支持互操作,提供开放的元数据收割接口;

    (4)数据存储库应支持数据的重用,提供通用的标准元数据和传播分发路径,为数据重用提供支持保障。

    2. 推荐数据存储库:

    •    科学数据银行Science Data Bank (ScienceDB)

    (1)ScienceDB共享的优点

    ScienceDB是中国科学院自主建设、遵循国际数据政策标准的通用型数据存储库,可面向全球科学家提供论文关联数据的在线提交、数据评审和数据发布服务。平台建设对接国际、国内主流标准规范,访问用户现已遍布全球。具体服务特色有:1)为数据作者提供标准化的数据发布服务,确保所有发布数据配备双标识,即数字对象标识符(Digital Object Identifier,DOI)和中国科技资源代号(CSTR),两者均可唯一标识数据。2)提供国际主流的数据使用许可协议,支持作者以CC0或CC BY 4.0的方式发布数据。3)提供数据引用推荐,引导数据使用者规范引用数据,以充分尊重和认可数据发布者的学术贡献。4)全站提供中英双语服务,确保发布数据的国际传播能力;与中国科学引文数据库(CSCD)联通,发布数据进入Google Dataset Search、Data Citation Index等平台索引传播。5)系统可自动记录平台各公开数据集的访问和下载情况,追踪发布数据的被引情况。并提供数据访问、下载情况的地域分布统计服务。6)用户在提交数据阶段可录入关联论文的相关信息,包括论文标题、论文发表刊物、论文DOI或CSTR等信息,提高论文的显示度。

    (2)ScienceDB发布论文关联数据的流程

    在ScienceDB上发布一个论文关联数据的流程包括:注册与登录、数据提交、数据审核、数据发布等4个步骤。详细流程及注意事项可详见https://www.scidb.cn/publishing_process

    3. 本刊资料论文(Data Paper)与论文关联数据提交的关系

    本刊的资料论文是指以植物生态学及相关学科的调查和实验数据资料为主要内容的学术论文。实验资料应呈现一个或一组实验完整的原始数据;调查资料应呈现特定尺度上(如群落、景观或区域)的调查数据。资料论文的正文部分在本刊正刊发表,附录数据资料部分可以单独存储在本刊网站或符合标准的数据存储库中,也可以同时提交本刊网站和数据存储库共同存储(在数据存储库不要求作者独家存储的前提下)。


    六、数据可用性声明

    提交了关联数据的论文,应当同时提交《数据可用性声明》。《数据可用性声明》是对论文关联数据是否可获取以及具体获取方式的说明文件或文字,其主要包括论文关联数据的存储方式、访问链接等内容。《数据可用性声明》的使用有助于提高研究透明度和可重复性,对论文结论的重复验证、数据重用、科研诚信等均具有重要意义。

    《数据可用性声明》应当包括以下内容:数据的存储方式及访问链接、数据的唯一标识符(如有)、打开或使用数据的软件或工具名称。若论文关联数据为不宜共享的数据,应当明确说明并给出访问数据的具体条件及方式。

    作者应将《数据可用性声明》附于论文正文之后、参考文献之前。


    七、数据的引用

    论文关联数据作为作者的智慧劳动成果应当得到尊重和认可,规范的数据引用能够提升科学数据的影响力,同时为引用该数据的研究提供佐证。引用内容应该包括但不限于作者、数据集名称、数据存储库名称、引用时间、DOI等。

    关联数据引用示例如下:

    Jin YL, Wang HY, Wei LF, Hou Y, Hu J, Wu K, Xia HJ, Xia J, Zhou BR, Li K, Ni J (2022). Plot-based photo dataset of plant community on the Qingzang Plateau. Science Data Bank. [2022-06-30]. DOI: 10.57760/sciencedb.01834.

    作者可对其论文关联数据的贡献认可方式在符合相关法律法规、规范性文件的要求下增加特殊说明,包括但不限于:引用、致谢、作为论文合作作者、作为产品合作开发者、经济补偿等。


    八、案例

            金伊丽, 王皓言, 魏临风, 侯颖, 胡景, 吴铠, 夏昊钧, 夏洁, 周伯睿, 李凯, 倪健. 青藏高原植物群落样方数据集. 植物生态学报, 2022, 46(7): 846-854. DOI: 10.17521/cjpe.2022.0174

    该文作者将群落照片作为关联数据于2022年6月14日在ScienceDB成功发布,截至2022年10月25日该数据集已被下载14412次。


    九、咨询与帮助

    更多有关论文关联数据提交的问题,请咨询:

    编辑部:cjpe@ibcas.ac.cn

    ScienceDB: sciencedb@cnic.cn


    《植物生态学报》编辑部

    20221026


发布日期:2022-10-26 浏览: 333

  • 微信服务号: zwstxbfw

  • 微信订阅号:zwstxb

  • 淘宝店订购

  • 微店订购