胡杨
- 作品数:6 被引量:17H指数:3
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金国家科技型中小企业技术创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于标签相似度的不良信息多标签分类方法被引量:8
- 2016年
- 在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,通过改进经典的多标签分类算法RAk EL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAk EL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。与传统的分类方法在真实的语料库上进行多标签分类效果对比,结果证明,该方法对不良信息分类具有较好的效果。
- 刘卓然胡杨刘骊冯旭鹏刘利军黄青松
- 关键词:不良信息
- 基于情感角色模型的文本情感分类方法被引量:3
- 2015年
- 针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所在语句进行情感标注,确定潜在评价对象所在语句的正负极性,并定义其情感角色;然后,改进特征权值计算方法,将情感角色对应的倾向值融入模型特征空间中;最后,通过特征聚合对特征空间实现模型降维。实验结果表明,所提方法与提取强主观性情感项作为特征的情感分类方法相比,分类准确率约提高3.2%,可有效改善文本情感分类效果。
- 胡杨戴丹刘骊冯旭鹏刘利军黄青松
- 关键词:文本情感分类向量空间模型
- 基于主题角色的文本情感分类方法被引量:2
- 2017年
- 传统文本情感分类方法通常以词或短语等词汇信息作为文本向量模型特征,造成情感指向不明和隐藏观点遗漏的问题。针对此问题提出一种基于主题角色的文本情感分类方法。该方法首先提取出文本中的潜在评价对象形成评价对象集,评价对象作为情感句描述的主体能够很好地保存文本情感信息;然后使用LDA模型对评价对象集进行主题抽取,将抽取出的主题分裂成"正""负"两种特征项,将这两种特征项记为正负主题角色用于保存文本情感信息;最后,计算主题角色在文本中的情感影响值并建立主题角色模型。实验结果表明,所提方法与传统方法相比可有效提高主观性文本情感分类的准确率。
- 刘晨晨冯旭鹏胡杨刘利军黄青松段成香
- 关键词:文本情感分类LDA主题抽取
- 基于层叠条件随机场的微博热点话题跟踪
- 2016年
- 微博文本的数据稀疏特性,使传统话题跟踪技术只能捕获部分话题微博且准确度不高。同时,在追踪过程中,话题会出现漂移现象。针对以上两个问题,提出一种基于层叠条件随机场的微博热点话题跟踪方法。该方法先通过标识模型标识出可能相关的微博,源热点微博和标识微博分别作为分类模型的观察序列和状态序列来计算相关度分类。其次,通过构造自适应模型对识别模型进行更新且削弱数据稀疏问题,并从相关微博中选取新的观察序列,其余作为新的状态序列进行迭代分类处理。实验表明,该方法比传统方法综合指标F值平均提升4.13%。
- 戴丹胡杨刘骊冯旭鹏刘利军黄青松
- 关键词:层叠条件随机场
- 最小费用最大流跨领域情感分类框架被引量:1
- 2017年
- 在对文本的情感极性进行分类的过程中,针对标注训练数据与待判断情感极性的数据来自不同领域,特征分布差异较大,导致传统监督学习方法分类准确率大幅下降的问题,提出基于最小费用最大流框架的跨领域情感分类方法.该方法将跨领域情感分类问题转化为最大化领域间传播信息量和最小化跨领域特征拟合损失量的双重最优化问题,并建立连接源领域和目标领域的费用容量网络,将信息量和损失量分别看作网络中的容量和费用权值,通过最小费用最大流框架解决上述双重最优化问题,调配训练数据特征权值.以更为直观的模型描述领域间的映射关系.实验发现,方法能有效提高跨领域情感分类的准确率.
- 胡杨冯旭鹏戴丹刘利军黄青松
- 关键词:情感分类最小费用最大流
- 面向短文本情感分类的特征拓扑聚合模型被引量:3
- 2016年
- 由于短文本极稀疏性和特征分散的特点,短文本的情感分类效果总是不及篇章文本的情感分类,针对此问题,该文提出面向短文本情感分类的特征拓扑聚合模型。模型首先从特征点互信息,情感指向相似度,主题归属差异值三个维度整合计算情感特征的关联度,然后根据特征关联度建立拓扑聚合图模型,通过在图上求解强联通分量聚合高关联度情感特征,从大量未标注语料中提取相似特征对训练集特征进行补充,同时降低训练空间维度。实验将模型应用于短文本情感分类,与基准算法对比能提高分类准确率和召回率分别达0.03和0.027。验证了模型在缓解短文本极稀疏性和特征分散问题上的效果。
- 胡杨冯旭鹏黄青松付晓东刘骊刘利军
- 关键词:情感分类拓扑聚合