刘鹤
- 作品数:3 被引量:42H指数:2
- 供职机构:北京工业大学经济与管理学院更多>>
- 发文基金:北京市自然科学基金北京市社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 专利发明等级分类建模技术研究被引量:1
- 2017年
- 【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型。【结果】获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1︰4,符合实际情况,证明了该模型可行性。【局限】由于使用了Word Net词典,对于技术特征词汇的抽取会受到词典收录局限的影响。【结论】该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利。
- 翟东升胡等金张杰何喜军刘鹤
- 一种基于链路预测的技术机会挖掘方法被引量:35
- 2016年
- 本文提出一种使用链路预测方法判断技术融合趋势,从而实现技术机会预测的方法。利用专利间的引用关系,构建IPC引用网络表征知识间的流动,以此网络为基础,训练基于SVM的未来链接预测模型用于预测可能首次出现的技术流动,基于线性回归的链接边权预测模型用于预测未来会有更深程度融合的技术,综合两种模型的结果确定技术机会。最后,本文利用云计算专利数据验证了该方法的有效性,并对云计算的技术机会进行了预测。
- 翟东升刘鹤张杰蔡力伟
- 关键词:链路预测复杂网络
- 基于图形数据库的专利语义知识库构建技术研究被引量:6
- 2016年
- 【目的】针对德温特专利数据设计并实现语义完整、性能良好的专利语义知识库。【应用背景】专利语义知识库用于存储专利数据以及各项数据之间存在的语义关系,使得人们可以通过语义关系对专利进行检索。【方法】通过分析德温特专利数据所含及其之间的语义关系,改进基于本体的专利语义表示方法,提出基于属性图模型的德温特专利图数据模型,并使用Neo4j图形数据库存储实例化的专利数据。【结果】以云计算技术为例,构建专利语义知识库,该知识库保证了语义信息完整,在较大数据量的情况下,查询速度可达到传统关系型数据库的5.35倍。【结论】基于图形数据库的专利语义知识库有着信息完整、语义清晰、性能良好等特点,是一种稳定且高效的专利数据组织与存储方式。
- 翟东升刘鹤张杰蔡力伟
- 关键词:专利信息语义关系知识库图形数据库