《国外社会科学》
社会科学科研数据主要集中在社会、经济领域。社会科学数据管理与服务平台对于切实改变传统的科研数据私有观念,打破信息壁垒,实现科研数据的合理流通和最大限度地共享起着举足轻重的作用[1]。欧美主流的社会科学数据研究机构,均构建了社会科学科研数据平台开展科研数据管理并提供服务[2]。近年来,国内的一些机构和高校也逐渐认识到社会科学数据管理与服务平台构建的重要性,并逐步开展这方面的实践。出现了复旦大学社会科学数据平台、北京大学开放研究数据平台、中国人民大学中国国家调查数据库、湖南大学经济数据研究中心等机构层面的平台。但整体而言,处于起步探索阶段,平台功能远不够完善,国家层面面向社会科学学科领域的公共数据平台尚未出现,由于缺乏技术和服务支撑,大部分高校和科研机构的社会科学科研数据缺乏应有的重视,处于流失状态。
德国是世界主要经济强国之一,是欧盟国家中重视信息化建设、信息化程度较高的国家之一,也是开放获取思想和倡议的发起者及实践先驱之一[3]。作为欧洲开放科学云(EOSC)计划的主要参与者和推动者,一直负责通用数据基础设施建设工作。2014年,在全面收集和分析科研机构的需求后,由德国莱布尼茨学会资助,莱布尼茨社会科学研究所、莱布尼茨经济学信息中心、柏林社会科学中心和德国经济研究所合作开发了社会科学科研数据平台SowiDataNet|Datorium,它是面向具体学科领域的国家层面的公共数据平台,目标是支持实现德国社会经济学领域科研数据的统一存储、安全归档和集中获取[4]。鉴于此,对SowiDataNet|Datorium进行全面的调研和分析,将国内5个平台与SowiDataNet|Datorium进行对比,总结SowiDataNet|Datorium的特色与经验,为我国构建国家层面的社会科学公共数据平台提供启发和参考。
1 SowiDataNet|Datorium数据平台剖析
1.1 平台简介
SowiDataNet(
SowiDataNet|Datorium的开发借鉴了GESIS数据共享平台Datorium的开发经验。Datorium专注于社会科学科研人员个人的数据。在Datorium中,科研人员可以自行记录、共享、管理和发布其数据,使数据可见并可用[6]。SowiDataNet|Datorium则专注于机构的数据,解决德国只有少数科研机构能够使用自己的资源来构建可持续运行的科研数据基础架构这一问题,它特别强调平台与机构科研数据管理实际工作流之间的灵活衔接,强调要考虑经济科学领域和科学机构的特殊需求。为此,SowiDataNet|Datorium调整了Datorium所有的工作流程、元数据字段、受控词表以及数据监管过程等,还增加了数据版本控制。GESIS致力于整合Datorium和SowiDataNet,目前SowiDataNet|Datorium已被集成到GESIS的存储和发布服务中。
1.2 数据服务
1.2.1 数据存储者
SowiDataNet对“科研数据”进行了广泛定义以涵盖各种数据类型。平台中可能包含由实证研究工具新生成的一次数据和从现有信息中推断出的二次数据,可以整合一次数据和二次数据,以及用于数据转换和分析的程序或脚本。此外,还可以提供便于以后使用数据的文档(如问卷、代码簿或技术报告)。要将数据提交到SowiDataNet|Datorium中,数据存储者首先必须注册,并在注册表格中输入地址和与机构的隶属关系。注册完成后即可在SowiDataNet|Datorium中上传和存储数据,数据发布之前,GESIS的负责人将对其进行审查。如果存储者所属机构与GESIS签订了SowiDataNet|Datorium的使用合同,那么SowiDataNet|Datorium会将数据同步分配给机构,由机构管理员进行审查。具体步骤是:
第一步,科研人员建立新的数据项目,上传数据,附上问卷、代码本或语法文件,并使用标准化元数据进行描述。在编辑过程中,可以使用评论功能记录未解决的问题和开放问题,评论内容会及时转发给管理者。一旦完成数据上传,数据就会被转移到机构数据池中。第二步,机构管理员访问数据池,选择项目进行内容审查。管理员会根据正式标准(即可读性、完整性、数据保护规定和正确描述)检查数据、元数据和文档。如必要,管理员在与相关科研人员讨论并达成一致后可修改或更正文件。SowiDataNet|Datorium提供了一个标准化的检查表来帮助机构数据管理员审查所提交的数据(如图1)。未来,计划开发面向特定科研机构的检查表。第三步,机构完成审查后,管理员把数据发送给GESIS,由GESIS的管理员进行再审查,通过后,注册服务da|ra为数据分配DOI,并使数据及其元数据在da|ra、DataCite元数据门户以及所有利用元数据收割的服务(如OAI-PMH)中均可见,且能与和OpenAIRE等集成。