江苏省普通高校研究生科研创新计划项目(CXZZ11-0483) 作品数:4 被引量:18 H指数:2 相关作者: 王士同 胡文军 王娟 应文豪 顾鑫 更多>> 相关机构: 江南大学 湖州师范学院 更多>> 发文基金: 江苏省普通高校研究生科研创新计划项目 国家自然科学基金 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
最大向量夹角间隔核分类 2012年 提出了一种最大向量夹角间隔MAMC分类方法,其核心思想是在样本特征空间中寻找一个尽可能靠近训练样本中心的向量c,进而强化更小的VC维,同时未知样本点可以根据向量c和训练样本点之间的最大向量夹角间隔ρ进行分类.提出的MAMC方法可以通过核化提高算法的灵活性,而在MAMC方法的实现上,只需解决一个对应的二次凸优化问题,实现简单.同时,MAMC的v×v1参数属性构成了支持向量个数的下界和错分训练样本数的上界;而其所对应的硬划分版本可以等价于一种特殊和核化的最小包含球,因此能够训练较大样本.最后,人造和真实数据集实验结果表明,MAMC整体上具有较好的性能优势. 胡文军 王士同 陶剑文关键词:分类器 向量夹角 支持向量 核函数 一般化最小包含球的大样本快速学习方法 被引量:3 2012年 标准最小包含球(Minimum enclosing ball,MEB)模型的对偶问题可视为MEB问题并能够利用核心集向量机(Core vector machine,CVM)实现大样本的快速训练,但对于一般化MEB模型,对偶问题中的不等式约束发生了变化而不能视为MEB问题,不能方便地使用CVM来解决大样本的快速训练.为此,提出了一般化MEB快速学习方法(Fast learning of generalized MEB,FL-GMEB),首先放松对偶问题中的不等式约束条件,使其等价于中心约束的MEB问题,从而利用CVM获得其核心集(Coreset,CS);然后利用局部线性嵌入(Locally linear embedding,LLE)的逆思想将CS扩充为拓展核心集(Extended core set,ECS);最后将ECS及其对应的优化权作为一般化MEB模型的逼近解.UCI和USPS数据集上的实验结果表明,FL-GMEB在大样本快速训练方面具有较好的性能优势. 胡文军 王士同 王娟 应文豪关键词:大样本 隐私保护的SVM快速分类方法 被引量:14 2012年 许多核分类方法的决策函数可以表示为支持向量的组合,如SVM,而支持向量含有非常重要的隐私信息,因此,在分类决策时可能会暴露此类信息,同时分类速度受限于支持向量的个数,如SVM的分类复杂度为O(|SVs|).为解决上述两个问题,本文基于最小包含球球心在原始空间中的代理原像,提出了一种隐藏支持向量信息并能快速实现分类的SVM方法,称为隐私保护的快速SVM分类方法(Fast Classification Approach of SVM with Privacy Preservation,FCA-SVMWPP).同时提供了两种求解代理球心原像的方法,分别称为QP解法和直接解法.UCI和PIE人脸数据集的实验结果表明,本文方法可解决上述两个问题并具有较好的效果. 胡文军 王士同关键词:支持向量机 基于数据分类的领域自适应新算法 被引量:1 2014年 一般的机器学习都假设训练数据与测试数据分布相同,而领域自适应算法则是在不同数据分布条件下进行知识传递和学习,在数据挖掘、数据校正、数据预测等领域有着广泛的应用。支持向量机SVM的主要思想是针对二分类问题,在高维空间寻找一个最优分类超平面,以保证最小的分类错误率。CCMEB理论由Tsang I提出的,是一种改进了核向量机CVM的最小包含球算法,在大样本数据集处理上有着较快的速度。而CCMEB理论同样适用于二分类的SVM数据集。将SVM理论、CCMEB理论与概率分布理论相结合,提出了一种全新的基于数据分类的领域自适应算法CCMEB-SVMDA,该算法通过计算各自分类数据组的包含球球心,能够有效地对不同领域数据进行整体校正和相似度识别,具有较好的便捷性和自适应性。在UCI数据、文本分类等数据上对该算法进行了验证,取得了较好的效果。 顾鑫 王士同关键词:支持向量机 领域自适应