您的位置: 专家智库 > >

国家科技支撑计划(2011BAH10804)

作品数:2 被引量:33H指数:2
相关作者:徐硕朱礼军乔晓东薛春香张运良更多>>
相关机构:中国科学技术信息研究所南京理工大学中国人民大学更多>>
发文基金:中国科学技术信息研究所预研基金项目国家科技支撑计划教育部人文社会科学研究基金更多>>
相关领域:文化科学自然科学总论更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇文化科学
  • 1篇自然科学总论

主题

  • 1篇频繁项
  • 1篇频繁项集
  • 1篇频繁项集挖掘
  • 1篇最大频繁项集
  • 1篇最大频繁项集...
  • 1篇文本挖掘
  • 1篇项集
  • 1篇聚类分析
  • 1篇共词分析
  • 1篇共现
  • 1篇共现分析
  • 1篇抽取
  • 1篇抽取方法
  • 1篇词形

机构

  • 2篇中国科学技术...
  • 1篇南京理工大学
  • 1篇中国人民大学

作者

  • 2篇乔晓东
  • 2篇朱礼军
  • 2篇徐硕
  • 1篇张运良
  • 1篇安小米
  • 1篇桂婕
  • 1篇韩红旗
  • 1篇薛春香

传媒

  • 2篇情报学报

年份

  • 1篇2013
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
基于词形规则模板的术语层次关系抽取方法被引量:11
2013年
术语层次关系抽取是领域概念关系体系构建的重要基础。针对目前术语关系抽取中手工实现的问题,提出了基于词形规则模板匹配的术语层次关系抽取方法,实现从科技论文文本中抽取类属关系(IS-A)和整体部分关系(PART—OF)关系。利用复合术语的head和modifier特征,比较两个术语之间存在的边缘共用词汇,构造模板来确定它们之间的IS—A和PART-OF关系;提出泛化度指标,用于测量两个术语在概念层次树上的相对位置;提出相关度概念,用于测量两个术语之间在语义上的相关性。对不存在共用词汇和不匹配模板的术语采用泛化度差值和相关度来判断它们之间是否存在层次关系。实验从信息资源管理领域的论文文本中提取层次关系术语对1306对,准确率达到92.5%,证明提出的方法是有效的。
韩红旗徐硕桂婕乔晓东朱礼军安小米
关键词:文本挖掘
共现聚类分析的新方法:最大频繁项集挖掘被引量:22
2012年
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。
徐硕乔晓东朱礼军张运良薛春香
关键词:共现分析共词分析聚类分析最大频繁项集
共1页<1>
聚类工具0