国家教育部博士点基金(200801080006)
- 作品数:25 被引量:182H指数:8
- 相关作者:李德玉王素格宋晓雷李红霞陈红星更多>>
- 相关机构:山西大学山西大同大学科学出版社更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金山西省自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论理学交通运输工程更多>>
- 基于赋权粗糙隶属度的文本情感分类方法被引量:19
- 2011年
- 提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能.
- 王素格李德玉魏英杰
- 关键词:文本情感分类文本表示离散化
- 面向观点挖掘的汽车评价本体知识库的构建被引量:13
- 2011年
- 建立了面向观点挖掘的汽车评价本体知识库,可为挖掘汽车整体信息和特性信息观点提供强大的数据资源。以汽车领域知识为背景,根据汽车知识的关系,构建了汽车评价本体知识库的概念关系。在此基础上,利用Web汽车评论真实语料库,自动获取了本体知识库中的核心概念。最后,采用OWL描述语言,构建了面向观点挖掘的本体知识库。
- 冯淑芳王素格
- 关键词:本体知识库
- 基于概率潜在语义分析的词汇情感倾向判别被引量:15
- 2011年
- 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。
- 宋晓雷王素格李红霞李德玉
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向
- 相对知识粒度序决策表的属性约简方法
- 2011年
- 序决策表中的知识约简越来越受到关注,在优势类和知识粒度的基础上,引入了序决策表中的一种知识相对粒度,度量了属性集在序决策表中的相对不确定性,进而给出了属性相对重要度的定义。并设计了序决策表的一种启发式属性约简算法,通过实例分析和验证了算法的有效性。
- 贾俊芳
- Web环境下基于SOAOffice中间件的合同生成与数据抽取方案被引量:4
- 2012年
- 合同生成是合同管理系统中一个重要组成部分。通过分析以往Web环境下合同管理系统存在的缺陷,给出一种新的合同生成方法。本方法解决了以往合同管理系统存在的多个问题,将合同生成与合同管理有机地结合起来,实现了合同签订模板化、合同审批网络化、数据抽取自动化、合同管理高效化、准确化、标准化。这种方法是在设计合同生成及后期管理数据结构的基础上,制作各类word合同模板并通过SOAOffice中间件实现Web环境下数据抽取与组合,完成合同网上审批及管理功能。
- 剌奋华陈红星李德玉翟岩慧
- 关键词:数据抽取
- 一种有效的高维分类数据聚类方法研究被引量:2
- 2011年
- 随着数据规模的不断增大,提高K-modes聚类算法或模糊K-modes聚类算法的运行效率成为了一个重要问题.为了提高其算法执行效率,提出了一种基于分治法的高维分类数据聚类方法.该方法并不是一次性对所有的数据进行聚类,而是将分类数据集分成若干个子集,对每个子集同时进行聚类,最后对聚类结果进行融合以形成最终的聚类结果.实验结果表明大多数情况下较传统的方法在聚类的速度上有显著的提高.
- 贾俊芳李德玉
- 关键词:聚类分析模糊聚类分治法分类数据评价指标
- 文本褒贬倾向判别研究
- 2011年
- 在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。
- 李银花王素格
- 关键词:概率潜在语义分析FISHER判别准则支持向量机
- 基于粗糙集的交通道路与城镇用地扩展关系分析被引量:8
- 2010年
- 交通道路是城镇用地扩展的重要驱动力因素之一,对城镇用地的扩展具有积极的作用。城镇用地的扩展也不断地对交通道路的发展提出新的需求。目前,众多的数理方法和空间模型已用以研究交通道路与城镇用地扩展之间的相互作用。为了更加有效地分析交通道路与城镇用地扩展的作用关系,以更加有效地研究交通道路与城镇用地扩展的相互作用程度和模式,需进一步探索新的技术方法和手段。本文利用粗糙集理论,以广东省城镇化问题为例,从一个新的角度来研究交通道路与城镇用地扩展之间的关系。结果表明,使用粗糙集抽取的反映交通道路和城镇用地扩展的决策规则可以有效地反映交通道路与城镇用地扩展的关系,对于城镇化的研究具有一定的指导作用。
- 曹峰宋海荣葛咏李德玉
- 关键词:交通道路粗糙集
- 基于概率潜在语义分析的词汇情感倾向判别
- 本文利用概率潜在语义分析,给出了两种用于判别词汇的情感倾向的方法。一种是使用概率潜在语义分析获得每个目标词和基准词之间的相似度矩阵,再利用投票法决定每个目标词的情感倾向;二是利用概率潜在语义分析对目标词进行语义聚类和扩展...
- 宋晓雷王素格李红霞
- 关键词:概率潜在语义分析数据稀疏语义聚类情感倾向
- 文献传递
- 基于混合语言信息的词语搭配倾向判别方法被引量:8
- 2010年
- 具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。
- 王素格杨安娜
- 关键词:计算机应用中文信息处理词语搭配