吴天星
- 作品数:32 被引量:230H指数:2
- 供职机构:东南大学更多>>
- 发文基金:国家自然科学基金国家建设高水平大学公派研究生项目江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生语言文字更多>>
- 一种基于知识图谱技术的分布式系统故障根因溯源方法
- 本发明公开了一种基于知识图谱技术的分布式系统故障根因溯源方法,用于解决大型分布式系统故障根因溯源困难问题。分布式系统故障根因溯源任务是找出导致系统故障的根本原因。本发明针对分布式系统中的故障为每类故障构建了故障知识图谱,...
- 吴天星罗安源漆桂林方苏东
- 一种基于机器学习的图书本体匹配方法
- 本发明公开了一种基于机器学习的图书本体匹配方法,主要用于处理图书领域的本体匹配问题。本发明首先对于给定的两个图书本体生成所有待匹配的实例对与概念对,再利用启发式实例匹配规则与基于监督学习的决策模型从所有待匹配的实例对中挖...
- 吴天星漆桂林罗斌陆彬
- 一种基于机器学习的社交网络本体构建方法
- 本发明公开了一种基于机器学习的社交网络本体构建方法,主要用于处理社交网络上的标签之间的上下位关系(即传统意义上的包含关系)的判定以及相应的本体的构建问题;从社交网络上抓取标签作为原始的数据集。本发明首先设计了6个特征值用...
- 吴天星李丞漆桂林
- 面向Web表格的成对实体联合消歧方法
- 本发明公开了面向Web表格的成对实体联合消歧方法,用于解决面向Web表格的实体链接任务。面向Web表格的实体链接任务是将Web表格中的实体提及无歧义的链接到知识库中的实体。本发明针对表格特点设计成对实体联合消歧方法,迭代...
- 吴天星李林漆桂林
- 文献传递
- 面向社交站点的双语知识图谱构建方法的研究
- 随着语义网的不断发展,由数百亿RDF三元组构成的相互链接的不同类型的数据集在万维网中发布,这些数据集又称为知识图谱,是辅助语义搜索、问答系统、情报分析等众多智能应用的重要基础资源。因此,构建知识图谱已成为学术界与工业界共...
- 吴天星
- 关键词:信息处理语义网
- 文献传递
- 一种基于机器学习的戊肝发病率预测方法及系统
- 本发明公开了一种基于机器学习的戊肝发病率预测方法及系统,包括如下步骤,首先收集被预测地区的30天戊肝发病率、30天平均气温、30天平均降水量、30天平均水气压和30天百度指数;再对获得的数据进行整合和划分,形成数据格式[...
- 朱曙曈王明灏吴天星
- 一种知识图谱动态更新方法
- 本发明公开了一种知识图谱动态更新方法,用于解决百科知识图谱和其数据源之间的同步问题。本发明以万维网上的热点内容作为起点;从中抽取出命名实体作为种子实体,通常这些实体是可能发生更新的实体。然后在百科网站上抓取和种子实体相关...
- 漆桂林李丞李林吴天星
- 文献传递
- 构建中文大规模开放链接模式关键问题的研究
- 近年来,随着语义网的飞速发展,越来越多的数据以结构化的形式(RDF)发布在万维网上,并且链接数据开启了将分布在万维网各处的结构化数据进行关连的行动。开放链接数据项目是目前最大的对语义数据进行发布和互连的社区工作。它将万维...
- 吴天星
- 关键词:语义网络
- 文献传递
- 基于开放域抽取的多文档概念图构建研究被引量:2
- 2020年
- 在信息过载的背景下,如何从拥有共同主题的多篇文档中挖掘并组织核心概念及其语义连接已成为当前信息抽取任务中的一项重要挑战。为此,提出了一种新颖的基于开放域抽取的多文档概念图构建方法。首先基于预定主题挖掘主题词,通过改进的TF-IDF算法对文档进行排序;然后通过共指消解、篇章权重计算、三元组实例抽取等一系列步骤从多篇文章中抽取出大量具有事实表达能力的三元组实例。为去除开放域方法本身的噪声以及提高信息抽取的准确率,提出一种三元组实例过滤算法。通过该算法可有效提取高置信度且具有良好语义兼容性的显著关系实例集合,并构成多个概念子图。最后,将不同子图中的等价概念以及关系进行合并,形成一张具有较好主题表达能力的连通概念图。通过在signal media新闻数据集上进行验证,实验结果表明,所提出的方法能够跨文档组织重要的主题信息,形成的概念图在主题概念覆盖率、关系实例的兼容性等指标上均取得了较好的效果。在实际的应用场景中,概念图作为一种重要的多文档内容表现形式,对于用户进一步探索指定主题的发展脉络以及生成自动文档摘要均具有重要的参考价值。
- 盛泳潘付雪峰吴天星
- 关键词:多文档
- 基于规则挖掘的实例匹配方法
- 本发明公开了一种基于规则挖掘的实例匹配方法,用于解决不同知识库之间的融合问题。本发明的方法包括步骤:1)将多个知识库之间已知的等价实例作为种子集合;2)从种子集合的等价实例中挖掘出等价实例的匹配规则,并筛选掉上一轮评估效...
- 吴天星李林漆桂林