国家自然科学基金(61203284)
- 作品数:6 被引量:17H指数:2
- 相关作者:王石刘亮亮符建辉王卫民曹存根更多>>
- 相关机构:江苏科技大学中国科学院北京工业大学更多>>
- 发文基金:国家自然科学基金中国博士后科学基金博士科研启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉字种子混淆集的构建方法研究被引量:7
- 2014年
- 汉字混淆集是错别字识别中的重要资源之一。在本项研究中,首先手工整理了11935个汉字的可能的错别字,然后以这些汉字为节点、"可错成"关系为边,将混淆集构造成一个错别字混淆集图。由于人工总结错别字具有很大的局限性,因此在种子错别字混淆集图的基础上,设计了自扩展算法和开源外部补充算法来对错别字混淆集图进行扩展,以发现新的错别字对。根据实验,新发现了15133组错别字对。经过随机抽样校对,准确率达到87.35%。
- 施恒利刘亮亮王石符建辉张再跃曹存根
- 故障诊断知识建模及系统被引量:2
- 2016年
- 有效进行故障诊断可以提高客户满意度,故障诊断知识建模是其中的关键。针对故障诊断知识建模问题,提出基于本体元数据的故障诊断知识建模方法 KSM(Knowledge Solution Model):KSM主要由描述诊断方案的应用环境的元数据组和详细诊断方案(简称详细方案)构成。主要元数据包括:语种、方案名称、主题词、问题编号、产品线信息(如产品线、机型信息、部件信息等)、关联文档、访问角色、方案特征等。详细方案是一棵由多个步骤组成的树。步骤由一个或多个叶子步骤组成。叶子步骤不可再分。叶子步骤由一系列的引导状态、引导动作、用户应答和跳转指令等部分组成。该方法和模型成功应用于国内某大型IT企业。并于2010年正式上线。实验结果令人满意,结论是KSM可以有效解决故障诊断知识的建模问题,为后续的故障诊断建立知识基础。
- 王卫民贺冬春
- 关键词:故障诊断知识管理本体
- 基于Web的概念属性获取方法研究
- 2016年
- 属性是概念的内涵表达,描述概念的特征或性质,通过属性可以区分不同的概念,发现它们之间的差异。属性具备描述概念和鉴别概念的功能。基于Web的属性获取是指对给定的概念从Web网页中自动获取其属性集合。属性获取是概念知识获取的起点,也是领域本体自动构建的关键。文中从文本知识获取的角度对属性进行分类,并结合属性的元性质,探讨属性名称在Web语料中的基本表达方式(词汇句法模式),并通过词汇句法模式从大规模语料中获取属性名称,并且提出了基于统计和语义的候选属性验证方法。最后利用属性迭代获取模式进行属性迭代获取。通过几组概念的实例进行属性获取,实验结果表明,文中方法获取的属性的准确率较高。
- 刘亮亮汪平仄
- 关键词:知识获取语义
- 基于本体和语义文法的上下文相关问答被引量:7
- 2016年
- 在问答系统中,用户的提问通常不是孤立的,而是使用连续的多个相关的问题来获取信息,用户在与这样的系统进行交互时,才会感觉更自然。在已构建的非上下文相关问答系统的基础上,该文提出了一种可以处理上下文相关问题的方法并开发了系统OSG-IQAs。方法首先识别当前问题是否是一个从问题(follow-up),并判别其与前面问题的具体的相关类别,然后根据相关类别,利用话语结构中的信息对当前的follow-up问题进行重构,并提交到非上下文相关问答系统中。最后,将方法在两个不同规模的领域进行测试,并与相关系统或方法进行比较,测试结果表明,该方法具有较好的可扩展性。在总体测试中,该方法比基线系统获得了更好地效果,同时利用手工将所有上下文相关问题进行上下文消解,系统与此也进行了比较,并获得了相近的性能。
- 王东升王石王卫民刘亮亮符建辉
- 关键词:本体上下文
- 基于转发评论的微博语义扩充和分类方法
- 2015年
- 为了对微博用户、微博文本和微博评论进行分析和研究,提出了一种基于转发评论的微博语义扩充和分类方法.首先在对微博用户类型分析的基础上将微博分为6种类型;然后以信息发布型微博为研究对象,提出了微博评论选择算法,筛选出微博有效评论;再利用基于转发评论的微博语义扩充和分类(comment-based microblog's semantic expansion and classification,CBMSEC)方法,将微博有效评论信息补充进微博语义,改善微博数据稀疏的问题,提高微博的分类性能.
- 刘磊许志刚蔡海博王石