苏展
- 作品数:11 被引量:71H指数:6
- 供职机构:解放军理工大学理学院更多>>
- 发文基金:国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 一种基于类别信息的文本自动分类模型被引量:3
- 2010年
- 从理论角度分析基于互信息的特征选择方法的不足,提出一种改进的互信息特征选择方法;针对向量空间模型在文本表示方面的问题,使用类别空间模型将文本表示为矩阵,有效利用文本的类别信息,实现一种基于类别信息的文本分类算法。对中文文本的分类实验结果表明,该文本分类方法具有良好的分类效果。
- 刘海峰刘守生张学仁苏展
- 关键词:文本分类特征降维
- 基于贝叶斯理论的支持向量机综述被引量:8
- 2010年
- 支持向量机(SVM)以其坚实的理论基础,和在机器学习领域表现出的良好推广性能,获得了越来越广泛的关注。为更好地推进其发展,科研工作者们借鉴统计学中经典的贝叶斯理论,做了大量工作,例如:引进贝叶斯理论中先验知识、后验概率等概念,改进支持向量机中的判别准则;或利用贝叶斯理论估计支持向量机中的参数w、正规化参数以及核参数等。目前已取得不错的效果,使支持向量机理论更具有实用价值。
- 苏展徐立霞
- 关键词:支持向量机贝叶斯理论先验概率后验概率
- 基于聚类降维的改进KNN文本分类被引量:3
- 2010年
- 特征向量的高维性以及训练样本分布不均影响文本分类器性能。提出了一种聚类模式下的KNN改进方法。首先使用一种改进的聚类方法对文本特征集进行初步筛选,随后使用一种基于类别的改进KNN分类器进行分类,减少了噪声样本对测试样本类别判定的干扰。试验结果表明本文提出的分类模型在分类效率上得到提高。
- 刘海峰姚泽清刘守生苏展
- 关键词:特征降维聚类文本分类K近邻
- 将素质教育贯穿于数学教学的始终被引量:7
- 2011年
- 数学作为打开科学大门的钥匙,在素质教育中有着举足轻重的地位.本文通过几个典型案例,介绍了我们如何在数学教学的过程中贯彻素质教育的思想,以开发学员的学习潜能,启发学员的科学思维,调动学员的创造精神.
- 姚泽清苏展徐丹丹
- 关键词:素质教育数学教学
- 基于位置的文本分类样本剪裁及加权方法被引量:2
- 2015年
- k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。
- 刘海峰刘守生苏展
- 关键词:样本加权文本聚类K近邻文本分类
- 关于大学数学课堂教学的几点思考
- 大学数学是学生在大学学习期间一门重要的基础课程.但由于大学数学独特的学科特点,常常使很多学生思想上望而却步,极大的影响了教学互动,导致教学效果差强人意.因此,针对大学数学课程的特点以及培养目标的要求,本文结合笔者的教学实...
- 倪艳汪鹏苏展
- 关键词:大学数学课堂教学教学实践课程设置
- 文献传递
- 一种基于词频信息的改进CHI文本特征选择被引量:24
- 2013年
- CHI是一种常用的文本特征选择方法。针对该模型的不足之处,以特征项的频数为依据,分别从特征项的类内分布、类间分布以及类内不同文本之间分布等角度,对CHI模型进行逐步优化,使得特征项频数信息得到了有效利用。提出了一种基于词频信息的改进CHI模型。随后的文本分类试验证明了提出优化CHI模型的有效性。
- 刘海峰苏展刘守生
- 关键词:文本分类
- 文本分类中基于K-means的类偏斜KNN样本剪裁被引量:6
- 2012年
- KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能.
- 刘海峰姚泽清苏展张学仁
- 关键词:聚类
- 浅谈如何帮助学员在高等数学中发现美
- 高等数学作为军校非数学专业理工科学员的必修课,其重要性不言而喻,但由于信息量大,逻辑性强,抽象性高,易使部分学员敬而远之.本文就从历史、哲学、应用三个角度出发,谈谈如何帮助学员发现其中蕴含的美,从而走近高等数学.
...
- 苏展刘海峰倪艳
- 关键词:军事院校高等数学课历史观哲学思想
- 文献传递
- 基于词频的优化互信息文本特征选择方法被引量:13
- 2014年
- 互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分布上的差异以及类内不同文本之间分布上的差异等角度,通过引入特征项的类内频数因子、类内位置分布因子以及类间分布因子,提出一种改进的MI文本特征选择方法,使得特征项的频数信息在MI模型中得到有效利用,合理改善互信息模型在文本特征选择方面的不足。文本分类实验结果表明,改进MI文本特征选择方法的平均准确率、召回率分别提高约5.2%及4.6%,平均综合评价指标值提高约4.9%,有效提高了模型的文本分类效率。
- 刘海峰姚泽清苏展
- 关键词:文本分类互信息特征降维