教育部人文社会科学研究基金(10YJC870022)
- 作品数:10 被引量:126H指数:7
- 相关作者:刘萍刘勘周丽红胡月红李晶更多>>
- 相关机构:武汉大学中南财经政法大学更多>>
- 发文基金:教育部人文社会科学研究基金中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于马尔可夫链的舆情热度趋势分析被引量:42
- 2011年
- 针对舆情热度的波动范围较大,并会呈现某种趋势的特点,提出了一种基于马尔可夫链的舆情热度趋势分析模型。该模型采集相关热点舆情的指标数据,得到热度的时间序列值;分析热度的趋势变化,划分状态空间,构建状态转移矩阵,预测热度的趋势变化区间。实验表明,该方法能有效地预测热点舆情的走势,进而辅助对舆情的引导和控制。
- 刘勘李晶刘萍
- 关键词:网络舆情马尔可夫链
- 基于FCA和关联规则的情报学本体构建被引量:8
- 2012年
- 提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。
- 刘萍胡月红
- 关键词:本体构建情报学FCA关联规则
- 基于关键词的科技文献聚类研究被引量:18
- 2012年
- 描述一种基于改进TF-IDF特征词加权算法的科技文献聚类方法:首先提取科技文献的特征词;然后根据特征词的词频、所在位置和词性为特征词加权,建立科技文献的向量空间模型;接着使用基于密度的聚类算法对科技文献向量空间模型数据进行聚类分析;最后使用主成分分析法对科技文献聚类的结果进行标识,利用F-measure方法对聚类结果进行评价。实验表明,用提出的科技文献聚类方法能够从所检索的科技文献中发现热点研究领域,并能识别具有学科融合性质的研究方向。
- 刘勘周丽红陈譞
- 关键词:文本挖掘聚类
- 基于关联规则的科技文献分类研究被引量:9
- 2012年
- 针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。
- 周丽红刘勘
- 关键词:关联文本分类
- 基于本体概念的专长表示研究被引量:7
- 2012年
- 传统的专家识别系统大多采用一组带权重的关键词来表征专家的专长,然而这种基于关键词的专长描述不足以概括专家的研究主题。提出基于领域本体概念的专长表示方法,通过构建相应的领域本体来描述领域核心概念和概念间关系,利用谷歌距离来计算关键词到本体概念的语义相似度,完成关键词到概念的映射,从而得到基于本体概念的专长表示。
- 胡月红刘萍
- 关键词:本体语义相似度
- 基于VSM的专家领域分析及可视化研究被引量:1
- 2011年
- 根据专家所发表的学术论文对其研究领域进行分析和挖掘。首先抽取专家的有代表性的学术论文,构建这些论文的空间向量特征;然后与已构建的不同研究领域的空间向量做相似性分析,并通过对所有文章的综合,计算出专家在不同研究领域的权重;最后利用交互式可视化工具直观地分析专家的领域专长以及相互关系,并且根据专家之间学术研究的相似性对专家进行聚类分析。
- 刘勘刘萍
- 关键词:知识管理向量空间模型可视化
- 面向专家的知识地图研究被引量:11
- 2012年
- 文章首先介绍专家知识地图的定义、基本特征和分类,针对专家知识地图的基本特征、组成要素和实际应用情况,说明专家知识地图常用的构建方法,最后分别针对专家研究领域知识地图和专家社会网络知识地图进行了深入分析和举例说明。
- 刘勘周丽红
- 关键词:知识管理知识地图
- 基于共词网络的专家专长挖掘被引量:7
- 2012年
- 组织中专家专长的自动识别研究对组织保持组织竞争力具有重要作用,提出基于共词网络的专家专长挖掘方法。从专家相关文档集中抽取特征词形成共词网络,以社区划分的方法对词汇进行聚类,并根据点度中心度确定社区主题,从而自动识别专家专长。实验证明该方法能较好地揭示专家专长主题,精确度达到75.83%。
- 刘萍周梦欢
- 领域本体学习方法和技术研究综述被引量:15
- 2012年
- 分析本体学习的内容,对本体学习的发展进行评述;对领域本体学习过程中的几个关键任务——领域概念抽取、概念关系的识别进行深入的分析;总结领域本体学习的发展趋势。
- 刘萍胡月红
- 关键词:领域本体本体学习
- 词汇相似度研究进展综述被引量:16
- 2012年
- 从有背景信息和没有背景信息两个角度对国内外词汇相似度研究现状进行深入分析和比较。没有背景的统计方法不能真正挖掘出词对间的语义关系,语义词典也存在覆盖词汇范围有限等局限性,而维基百科作为含有语义词典功能的大型语料库,成为新的词汇语义信息的重要来源。详细阐述维基游走法、内涵概念图法和时间语义分析法这三种最新的基于维基百科的词汇相似度算法,指出词汇相似度研究今后将有机融合维基百科和其他背景信息,使各种词汇语义信息来源优势互补。此外运用复杂网络的分析方法来挖掘词汇网络中词汇的相关性将是词汇相似度研究的又一发展方向。
- 刘萍陈烨
- 关键词:词汇相似度语义相关度相似度计算