孙启干
- 作品数:7 被引量:21H指数:3
- 供职机构:重庆大学计算机学院更多>>
- 发文基金:重庆市自然科学基金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向Web文本检索的归一化一分类算法
- 信息检索作为互联网应用的重要组成部分,与人们的日常生活密不可分;而作为文本形式的web应用仍然是互联网的主流应用。如何从大量的Web文本中更加有效的检索信息,依然是许多科研人员所面临的难题。文本自动分类技术,不仅是自然语...
- 孙启干
- 关键词:信息检索文本分类
- 文献传递
- 面向文本分类的矩阵投影算法
- 2010年
- 对文本分类中降维技术、提高分类精度和效率的方法进行了研究,提出了一种基于矩阵投影运算的新型文本分类算法——Matrix Projection(MP)分类算法。矩阵运算将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化向量,有效地达到了降维与精确计算特征项权重的目的。与其他多种文本分类算法对比实验表明,MP算法的分类精度和时间性能都有明显提高,在两套数据集上的宏平均F1值分别达到92.29%和96.03%。
- 钟将孙启干李静
- 关键词:文本分类向量空间模型
- 基于文本分类的商品评价情感分析被引量:10
- 2014年
- 为了在准确判断商品评价情感倾向的同时提高识别效率,提出了基于矩阵投影(MP)和归一化向量(NLV)的文本分类算法实现对商品评价的情感分析。首先,利用矩阵投影提取商品评价的特征词;然后,计算每一类别中特征词的平均特征频率(FF),采用归一化函数(NLF)对平均特征频率进行归一化处理,得到每一类别的归一化向量;最后,通过比较评价的特征向量与每一类别的归一化向量的相似度预测评价的情感倾向。与k近邻(kNN)、朴素贝叶斯(NB)和支持向量机(SVM)算法进行了对比,实验结果表明该算法具有较高的预测准确度和分类速度:尤其与kNN算法相比该算法有明显优势,该算法的宏平均F1值比kNN高出12%以上,分类时间缩短了11/12;与SVM算法相比分类速度也大幅提高。
- 钟将杨思源孙启干
- 关键词:情感分析文本分类
- 面向Web信息检索的虚核文本分类算法被引量:3
- 2012年
- 提出一种虚核文本分类算法。通过单类别下标记数据的特征词频计算该类别虚核在每个特征项处的特征引力场强,进而获得类别虚核,根据类别虚核对待标记文本产生的引力大小判断其所属类别。实验结果表明,与k近邻算法和朴素贝叶斯算法相比,虚核算法在分类精度和时间开销方面具有较大的优势。
- 李静杨小帆孙启干
- 关键词:信息检索文本分类向量空间模型
- 基于归一化向量的文本分类算法被引量:7
- 2011年
- 基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。
- 钟将孙启干李静
- 关键词:文本分类向量空间模型
- 面向Web文本检索的归一化向量分类算法
- 信息检索作为互联网应用的重要组成部分,与人们的日常生活密不可分;而作为文本形式的web应用仍然是互联网的主流应用。如何从大量的Web文本中更加有效的检索信息,依然是许多科研人员所面临的难题。文本自动分类技术,不仅是自然语...
- 孙启干
- 关键词:信息检索文本分类
- 文献传递
- 一种新型的桥梁健康检测算法
- 2011年
- 针对大型桥梁故障诊断问题,提出一种新型高效的诊断算法。该算法将一座桥梁系统看成由大量的"团"组成,每个"团"由一个挠度检测点及其相应的传感器构成,具体分3个阶段进行:(1)受到"挠度共振"的启发,根据线性回归预测理论建立一个测试模型;(2)利用测试模型对所有"团"进行测试;(3)在测试基础上进行综合分析得出检测结果。对真实桥梁进行检测实验,结果表明该方法故障检测率达81.8%。
- 李静杨小帆孙启干
- 关键词:桥梁系统