中国博士后科学基金(2011M501155)
- 作品数:2 被引量:5H指数:2
- 相关作者:曾庆田赵华姜姗刘彤汤建渝更多>>
- 相关机构:山东科技大学更多>>
- 发文基金:中国博士后科学基金山东省优秀中青年科学家科研奖励基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于PDCA循环和文本挖掘的网络舆情监管方法被引量:3
- 2014年
- 为了完善网络舆情信息的监管机制,使网络舆情能够被有效的梳理和监管,提出了基于PDCA循环和文本挖掘相结合的网络舆情信息监管方法。该方法采用PDCA的计划、执行、检查、改进四个步骤来梳理网络舆情信息监管流程,而在执行阶段则融入文本挖掘方法实现智能决策分析。本文首先分析了目前网络舆情管理的现状,其次给出了基于PDCA循环和文本挖掘的监管方法的实施方案,其中重点阐述了信息获取、热点网络舆情发现、情感倾向性分析等文本挖掘方法在其中的应用。
- 姜姗赵华曾庆田
- 关键词:网络舆情PDCA循环文本挖掘
- 一个面向主题的学术文献数据分析工具
- 学术文献数量的迅速增长给科研工作者的文献调研工作带来了巨大的负担,因此设计并实现了一个面向主题的学术文献分析工具,为科研工作者从海量学术文献中快速准确地发现学科研究特性、分析学科发展趋势提供支持.本工具使用Latent ...
- 倪维健柳梅曾庆田刘彤汤建渝
- 关键词:主题模型LDA
- 文献传递
- 基于非平衡数据分类的单文档自动文摘方法被引量:2
- 2012年
- 自动文摘是自然语言处理领域的一个重要研究话题,基于机器学习的自动文摘方法则是该项研究中的一个热点。然而,自动文摘问题中的数据分布有一个重要现象,即文摘句子与非文摘句子的数量相差非常悬殊,该现象将给传统机器学习算法的应用效果带来负面影响。为此,本文针对自动文摘中句子类别分布严重不平衡这一现象,以支持向量机算法为基础,设计了两种有效的处理非平衡自动文摘数据的分类方法。在第一种方法中,将传统支持向量机中正负类平衡的分类间隔转换为不平衡的分类间隔;在第二种方法中,通过将数据集进行切分,设计了一种支持向量机集成学习算法。通过在DUC2001数据集上的实验证明,本文设计的两种基于非平衡数据分类的单文档自动文摘方法显著优于基于传统分类算法的自动文摘方法。
- 倪维健刘彤曾庆田赵华汤建渝
- 关键词:非平衡数据分类支持向量机分类器集成