李旸
- 作品数:13 被引量:51H指数:5
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于内涵模糊概念格的汽车评价知识发现方法研究被引量:2
- 2017年
- 为了有效利用汽车评论数据,参照已建立的汽车评价本体,从文本中抽取评价搭配对,提出基于五元组的对象评价度量,从而获取汽车评价模糊形式背景。在模糊形式背景中,定义了内涵模糊概念和内涵模糊概念格。设计了模糊形式背景和内涵模糊概念格构建算法,并以实例对如何基于内涵模糊概念格进行知识发现予以讨论。
- 李旸郭晓敏王素格梁吉业
- 关键词:汽车评价知识发现模糊概念格
- 基于E-CNN的情绪原因识别方法被引量:8
- 2018年
- 文本情绪原因识别作为一个新型的研究方向在文本情绪分析领域占据重要地位。该文结合卷积神经网络,提出了一种基于集成卷积神经网络的情绪原因识别方法。该方法通过词向量、卷积、池化等操作充分融合了句子的语义信息,利用多个CNN集成降低数据不平衡性对情绪原因识别的影响,克服了传统情绪原因识别方法的繁琐规则制定、特征抽取、特征空间降维等过程。实验结果表明,该文的方法在情绪原因识别方面取得了较好的效果,对于情绪归因的方法研究具有一定的指导作用。
- 慕永利李旸王素格
- 关键词:卷积
- 基于E-CNN神经网络的情绪原因识别方法
- 文本情绪原因识别作为一个新型的研究方向在文本情绪分析领域占据重要地位.本文结合卷积神经网络,提出了一种基于集成卷积神经网络的情绪原因识别方法.该方法通过词向量、卷积、池化等操作充分融合了句子的语义信息,利用多个CNN集成...
- 慕永利李旸王素格
- 关键词:文本分析神经网络
- 基于联合模型的商品口碑数据情感挖掘被引量:3
- 2017年
- 为了同时挖掘商品口碑数据中所谈论的对象、对象的某个方面以及评论者对这个方面的观点,用于指导消费者消费和生产厂家对商品的改进,该文面向口碑数据提出一个无监督对象方面情感联合模型。该模型假设方面分布依赖于对象分布,情感分布依赖于方面分布和对象分布,词是采样的最小单位。在汽车口碑数据上进行了多组实验,实验结果表明:无监督对象方面情感联合模型不仅可以判别文本方面和文本情感的类别,还可以获取文本对象信息。
- 王素格李大宇李旸
- 关键词:无监督学习
- 基于语言特征自动获取的反问句识别方法被引量:5
- 2020年
- 反问句是以疑问的形式表达强烈情感的修辞方式,对其有效识别可为自然语言处理中的情感分析任务提供技术支持。该文提出了一种基于语言特征自动获取的反问句识别方法。首先,利用标签注意机制,建立了一个数据驱动的特征抽取模型,用于获取与任务相关的词汇、句法结构、符号标记和话题等语言特征。其次,利用Bi-LSTM模型分别对句子和语言特征进行表示,两者的交互注意被用于获取句子的各个词和符号的注意力权重向量。该权重向量作用于句子的表示,用于构建一个强化语言特征的反问句识别模型。在中文微博数据集上的实验结果表明,提出的方法与之前的工作相比,反问句识别性能有显著提升。
- 李旸吴卓嘉王素格梁吉业
- 关键词:反问句特征抽取
- 融合反问特征的卷积神经网络的中文反问句识别
- 反问是一种带有强烈情感色彩的表达方式,对其进行自动识别将提升隐式情感分析的整体效率.针对汉语反问句识别问题,本文分析了反问句的句式特点,将反问句的句式结构融入到卷积神级网络的构建中,提出一种融合句式结构的卷积神经网络的反...
- 文治李旸廖健陈鑫王素格
- 关键词:反问句卷积神经网络
- 基于BootStrapping的集成分类器的中文观点句识别方法被引量:8
- 2013年
- 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。
- 吕云云李旸王素格
- 关键词:BOOTSTRAPPING集成分类器
- 融合反问特征的卷积神经网络的中文反问句识别被引量:5
- 2019年
- 反问是一种带有强烈情感色彩的表达方式,对其进行自动识别将提升隐式情感分析的整体效率。针对汉语反问句识别问题,该文分析了反问句的句式特点,将反问句的句式结构融入到卷积神级网络的构建中,提出一种融合句式结构的卷积神经网络的反问句识别方法。首先利用置信度大于70%的反问句的特征词、序列模式,对大规模未被标注的微博语料进行初步筛选,获取大量伪反问句。然后通过多个卷积核分别对句子的词向量和反问句的特征进行抽取,获取句子语义特征和反问词特征,将两者共同作用生成句子的表示。最后利用softmax分类器实现句子的分类。实验结果表明,利用该方法对微博中反问句的识别准确率、召回率和F1值分别达到了89.5%、84.2%和86.7%。
- 文治李旸王素格廖健陈鑫
- 关键词:反问句卷积神经网络情感分析
- 面向情感聚类的文本相似度计算方法研究被引量:8
- 2018年
- 在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。
- 李欣李旸王素格
- 关键词:文本相似度计算
- 基于可变最小贝叶斯风险的层次多标签分类方法被引量:2
- 2017年
- 层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中.当利用HMC-loss预测时,尽管得到的损失值是理想的,但实际预测的标签数却远多于真实的标签数.另外,层次信息的引入会对标签结点的决策顺序产生不利影响.针对这些问题,首先提出改进的损失函数IMH-loss,其次使用贝叶斯决策理论,提出了一种贝叶斯风险随决策过程可变的层次多标签分类方法.在真实数据集上的实验结果表明,该方法在保证召回率的同时,提升了标签预测精度.
- 徐智康李旸李德玉