董智鹏 作品数:11 被引量:37 H指数:5 供职机构: 中国科学院文献情报中心 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
中国ORCID注册平台iAuthor的设计与实现 被引量:5 2015年 【目的】为中国科研人员提供ORCID注册,并建立个人科研成果管理空间。【应用背景】ORCID致力于解决学术研究中的科研人员姓名歧义问题,而这一问题也长期困扰中国学术界,通过与ORCID合作,满足中国科研人员身份唯一识别需求。【方法】通过ORCID提供的API帮助科研人员注册或关联ORCID,以CAS IR、CSCD、Web of Science等作为基础数据源,快速形成科研人员成果信息,并自动建立个人学术主页。【结果】实现为科研人员获取ORCID的功能,科研人员可以对其个人信息和科研产出进行管理,并实现这些信息与ORCID系统的交互。【结论】中国ORCID注册平台i Author引起了国内科研机构和高校的广泛关注,并吸引了大量用户,为促进科研人员姓名歧义问题的解决奠定良好基础。 张建勇 黄永文 于倩倩 董智鹏 郭舒SSL协议的初步研究和应用 被引量:2 2010年 分析研究SSL协议的原理和工作流程,给出SSL协议应用的两个实例:一是在Web服务器上配置SSL协议以实现浏览器和Web服务器间的安全通信;二是设计和实现一个基于SSL协议的简单的网络聊天程序Demo。 董智鹏关键词:安全套接层 OPENSSL 网络安全 基于Drupal的项目网站建设——以“开放资源建设”网站为例 被引量:5 2016年 【目的】利用Drupal快速搭建"开放资源建设"项目的成果管理和发布网站。【应用背景】"开放资源建设"项目需要在有限时间和技术条件下建立成果发布平台,Drupal因其灵活简易、具备强大模块支持等特点能够满足该需求。【方法】采用Drupal基本模块和扩展模块完成内容建设和页面布局,并对主题定制、网站升级中的难点问题进行处理。【结果】利用Drupal短时间、低成本完成"开放资源建设"网站搭建和内容建设。【结论】Drupal能够很好满足图书馆快速搭建中小型项目网站或专题服务平台的需要。 董智鹏 刘静羽关键词:开源软件 开放资源 DRUPAL 一种基于动态多级匹配的大规模文献机构消歧方法 本发明提供了一种基于动态多级匹配的大规模文献机构消歧方法,涉及数据挖掘技术领域,包括:获取大规模文献机构原始数据,按照字段处理模板进行处理,并按照预设格式文件进行存储后生成消歧原始数据,建立多级匹配层,每个匹配层均包括重... 于倩倩 董智鹏 刘峥 邓彩虹 张建勇NSTL大数据管理与计算平台的设计与应用实践 2020年 本文针对国家科技图书文献中心(National Science and Technology Library,NSTL)业务流程再造目标,设计了满足NSTL需求的大数据管理和计算平台,提出了平台的业务架构、技术架构和平台构建的方案,并在大数据治理流程、分布式计算和微服务等方面开展了应用实践。大数据管理和计算平台建设解决了多源异构数据的存储问题和计算瓶颈,提高了数据管理和计算能力,为NSTL从文献服务向知识服务转变打下了坚实的数据平台基础。 董智鹏 常志军 张建勇 钱力关键词:业务流程再造 NSTL统一文献元数据标准的设计与思考 被引量:12 2016年 分析了NSTL统一文献元数据标准建设的必要性,介绍了统一文献元数据的设计目的是为保证NSTL发展战略目标的实现。元数据的适用对象涵盖NSTL所有科技资源。元数据的设计原则包括前瞻性原则、协同化原则、最小粒度原则、模块化原则和兼容国际标准原则。提出元数据设计思路,并详细介绍了其中的功能需求分析,构建了领域模型。本研究在元素和属性的选取方面主要参考JATS标准。 张建勇 于倩倩 黄永文 董智鹏关键词:NSTL 元数据 一种论文摘要蕴含细粒度知识元的抽取方法及装置 本发明公开了一种论文摘要蕴含细粒度知识元的抽取方法及装置,所述方法包括:确定知识元类型;建立知识元词库;使用bootstrapping技术自动扩充每种知识元类型的词库;获得知识元词库中的词语;使用词典匹配技术在论文摘要中... 余丽 钱力 赵华茗 董智鹏文献传递 一种基于动态多级匹配的大规模文献机构消歧方法 本发明提供了一种基于动态多级匹配的大规模文献机构消歧方法,涉及数据挖掘技术领域,包括:获取大规模文献机构原始数据,按照字段处理模板进行处理,并按照预设格式文件进行存储后生成消歧原始数据,建立多级匹配层,每个匹配层均包括重... 于倩倩 董智鹏 刘峥 邓彩虹 张建勇科研实体名称规范的研究与实践 被引量:8 2019年 【目的】建立机构规范、作者规范、期刊规范、基金规范,为发现系统、科研实体分析评价等建立数据基础。【方法】以多源异构数据为基础,对数据进行汇聚和融合,形成具有唯一标识符的统一的结构化数据。依据名称规范元数据模型,对科研实体及实体间的关系进行抽取。针对不同的科研实体可获取的文献特征,制定不同的消歧规则集合,结合传统字符串匹配方法和深度学习方法进行文本相似度计算。【结果】形成包含260多万条数据的机构规范库、2 300多万条数据的作者规范库、3万多条数据的期刊规范库和200多万条数据的基金规范库。以NSTL机构规范为例,与InCites机构规范进行对比,结果显示所遴选的美、英、中3个国家的6所高校,对标吻合度平均值达到86.8%。【局限】所提出的消歧规则和算法在处理文献特征表达形式多样性方面有待进一步细化和提升;需对具体数据源数据情况进行分析,以选择合适的算法模型。【结论】本研究提出了多源异构数据汇聚融合方法,设计了科研实体消歧规则和算法,能够有效实现名称规范数据库建设的规范性和全面性。 张建勇 钱力 钱力 董智鹏 于倩倩 董智鹏 郭舒 王峰一种论文摘要蕴含细粒度知识元的抽取方法及装置 本发明公开了一种论文摘要蕴含细粒度知识元的抽取方法及装置,所述方法包括:确定知识元类型;建立知识元词库;使用bootstrapping技术自动扩充每种知识元类型的词库;获得知识元词库中的词语;使用词典匹配技术在论文摘要中... 余丽 钱力 赵华茗 董智鹏