人文社科数据集搜索引擎上线

日期:2021-03-16        来源:实验室

      

   大数据时代,科学数据的开放共享受到各方高度重视,“数据爆炸”问题正在显现。随着科学研究转向数据密集型范式,许多学科对数据的需求十分强烈,基于共享的科学数据可支撑高质量研究成果产出。2018年,国务院发布《科学数据管理办法》,明确“开放为常态、不开放为例外”的科学数据共享原则。目前,科学数据正不断积累。据re3data.org统计,全世界至少有2600多个数据仓储;据DataCite统计,科学数据集至少有800多万个。如何高效地从众多开放数据中发现符合需求的有效数据正成为研究者面临的重要问题。因此,欧美等发达国家对开放科学数据集的统一发现做了大量研究,并推出众多应用平台,如谷歌数据集搜索DataMed等。

   

   目前,国内对开放科学数据集的统一发现还未得到充分关注,相关理论、方法研究及应用平台建设急需加强。北京大学SCIE实验室受到国家社会科学基金重点项目"开放科学数据集统一发现的关键问题与平台构建研究"资助,初步构建了“人文社科数据集搜索”平台,收录国内外13个重要科学数据仓储平台中的人文社科数据集,以及我国17个省级政府网站开放数据,可帮助人文社科研究人员查找数据,促进科学数据开放、共享和复用,推动我国新文科建设。

   

   人文社科数据集搜索引擎,临时URL: http://106.13.43.230/