[目的/意义]通过调研关联数据的研究文献,分析关联数据的研究的主题结构与研究进展。[方法/过程]综合采用文献综述方法、文献计量方法与可视化工具对Web of Science中的关联数据研究进行分析。其中,利用Citespace可视化软件分析了关联数据研究主体,利用VOSviewer将构建的关键词矩阵可视化。以关联数据的生命周期阶段为线索,结合关键词共现图谱,探寻了关联数据研究的主题结构与研究进展。[结果/结论]分析结果显示欧洲为关联数据研究的主阵地,Tim Berners-Lee等人在关联数据领域具备深厚的影响力。目前关联数据的研究覆盖了发布、优化、评价、应用等生命周期各个方面,但也存在一些薄弱环节,如在研究推动关联数据发布的进一步规范、实现实体自动丰富与链接、构建全面的质量评价体系与工具等方面存在挑战。
利用Thomson Data Anlyzer(TDA)、Incites软件,对科学引文索引扩展版(science citation index expanded,SCIE)文献数据库中收录的1980-2014年2月25日间的中国科学院地球表层系统科学7个研究机构SCIE论文进行数据挖掘与分析,通过年度发文与引文、高产作者与核心作者群、合作国家、基金资助、发文期刊等文献计量指标,参照2年影响因子、5年影响因子、h指数和ESI基准值,揭示和判定各个研究所的研究特色、优势、水平与实力。
[目的/意义]旨在研究将国家科技图书文献中心(National Science and Technology Library,NSTL)的科研实体名称规范数据发布为关联数据的难点——关联数据的数据模型。科研实体名称规范数据的数据模型研究,有助于NSTL科研实体数据的共享、互联、质量提升,融入到互联网中,同时也为其他机构使用、发布关联数据提供模型参考。[方法/过程]首先,分析比较国内外关联数据发布项目中所采用的数据模型,发现关联数据发布项目中的数据模型主要分为以Schema.org为核心和多种标准词表组合两类;结合NSTL名称规范数据的特点,设计两种形式的关联数据模型,并从关联数据模型对名称规范数据的表达程度、模型复杂度等角度进行比较,选择较优方案;最后以D2RQ为工具进行实验,将NSTL名称规范的样例数据发布为关联数据。[结果/结论]分析发现两种方案中以Schema.org为核心标准词表的方案相对于多种标准词表组合的方案有较优的表达完整度、较低的模型复杂度,更易于融入互联网,因此更适合作为NSTL名称规范数据的关联数据模型。