闫琰
- 作品数:2 被引量:26H指数:2
- 供职机构:中国矿业大学(北京)机电与信息工程学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于混合深度信念网络的多类文本表示与分类方法被引量:8
- 2016年
- 本文开展了基于混合深度信念网络的多类文本表示与分类方法的研究,以解决传统的Bag-ofWords(BOW)表示方法忽略文本语义信息、特征提取存在高维度高稀疏的问题。文章基于文本关键字,针对多类的分类任务(如新闻文本和生物医学文本),以关键字的词向量表示作为文本输入,同时结合深度信念网络(Deep Belief Network,DBN)和深度玻尔兹曼机网络(Deep Boltzmann Machine,DBM),设计了一种混合深度信念网络(Hybrid Deep Belief Network,HDBN)模型。文本分类和文本检索的实验结果表明,基于词向量嵌入的深度学习模型在性能上优于传统方法。此外,通过二维空间可视化实验,由HDBN模型提取的高层文本表示具有高内聚低耦合的特点。
- 翟文洁闫琰张博文殷绪成
- 关键词:文本分类文本表示
- 基于差异性的分类器集成:有效性分析及优化集成被引量:18
- 2014年
- 差异性是分类器集成具有高泛化能力的必要条件.然而,目前对差异性度量、有效性及分类器优化集成都没有统一的分析和处理方法.针对上述问题,本文一方面从差异性度量方法、差异性度量有效性分析和相应的分类器优化集成技术三个角度,全面总结与分析了基于差异性的分类器集成.同时,本文还通过向量空间模型形象地论证了差异性度量的有效性.另一方面,本文针对多种典型的基于差异性的分类器集成技术(Bagging,boosting GA-based,quadratic programming(QP)、semi-definite programming(SDP)、regularized selective ensemble(RSE))在UCI数据库和USPS数据库上进行了对比实验与性能分析,并对如何选择差异性度量方法和具体的优化集成技术给出了可行性建议.
- 杨春殷绪成郝红卫闫琰王志彬
- 关键词:分类器集成