山东省自然科学基金(2009ZRB019CE) 作品数:8 被引量:66 H指数:4 相关作者: 孙立民 丁福利 王立宏 刘苏苏 孙红霞 更多>> 相关机构: 烟台大学 更多>> 发文基金: 山东省自然科学基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 环境科学与工程 更多>>
优化支持向量机核参数的核矩阵方法研究 被引量:3 2013年 参数选取问题一直是支持向量机研究的热点.虽然核校准(KTA)方法广泛应用于支持向量机参数优化问题中,但是它仍存在不足.以核矩阵为研究出发点,深入分析了采用核校准方法优化核参数对分类性能的影响,然后综合核校准方法和特征空间中样本集的分布提出了一种核校准改进方法.对比实验表明该算法是有效可行的. 刘苏苏 丁福利 孙立民关键词:参数优化 核矩阵 两阶段近邻传播半监督聚类算法 被引量:2 2012年 近邻传播聚类算法(affinity propagation,AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi-supervised clustering algorithm based on affinity propagation,2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation,SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。 张友新 王立宏关键词:半监督聚类 先验信息 基于支持向量机的不平衡样本分类研究 被引量:7 2014年 分类问题是机器学习领域的重要研究方向之一。支持向量机是一种基于结构风险最小化的学习机器,在解决分类问题上有着出色的效果。但基于支持向量机的分类器在处理不平衡样本时,对少类样本分类准确率偏低。诸多研究在对此问题做分析时往往把主要原因归结为各类样本间数量上的不平衡,而没有充分考虑样本点在特征空间上的分布情况。针对此问题做出原因分析,并给出结论:样本的不平衡性主要是由特征空间下各类样本的分布所决定的,而和数量上的不平衡关系较小。通过实验验证结论的科学有效性。 丁福利 孙立民关键词:支持向量机 中文评教文本分类模型的研究 被引量:5 2012年 用文本分类的方法找出中文评教信息的情感倾向,使学生主观评价里蕴含的信息得到有效利用,是对现有评教系统的必要补充.采用基于潜在语义分析的方法对文本向量降维,并用支持向量机的分类方法对目标文本进行分类,得到每一条主观评价的情感倾向.分析了特征选择、特征抽取方法、降维维数、词性、训练集合与测试集合样本的比例等几方面对分类的影响,找到了较好的中文评教文本分类模型. 谭征 孙红霞 王立宏 潘庆先关键词:中文文本分类 支持向量机 潜在语义分析 支持向量机与RBF神经网络回归性能比较研究 被引量:43 2011年 支持向量机与RBF神经网络相比各有优缺点,通过对支持向量机与RBF神经网络的研究,从理论上分析了这两种学习机在回归预测原理上的异同,通过仿真实验对比了两者在测试集上的逼近能力及泛化能力。仿真结果表明,对于小样本集,支持向量机的逼近能力及泛化能力要优于RBF神经网络。对实际应用中回归模型的选择问题提出了建议。 刘苏苏 孙立民关键词:支持向量机 RBF神经网络 泛化能力 普通院校本科生开设数据挖掘课程的教学研究 被引量:3 2011年 分析了数据挖掘技术的课程特点,对数据挖掘技术教学过程中存在的问题进行了剖析。以此为基础,针对性地提出提高课程教学效果的相关对策建议。 谭征 孙红霞 王立宏关键词:数据挖掘 课程 教学研究 两种参池底质中氮、磷含量及其分布特征 被引量:3 2013年 为明确沙质、淤泥质参池底质中氮、磷变动规律,于2011年3月至11月分别对此2种参池进水口、中间区和排水口的底质的上层(0~2cm)、下层(3~5cm)进行了定点采样,分析了不同底质中总氮、总磷的时空分布特征。结果表明:(1)沙质中总氮含量为(0.16±0.05)~(0.29±0.03)mg·g-1,变化范围较小。淤泥质中总氮含量为(0.13±0.06)~(0.67±0.09)mg·g-1,变化范围大,总体呈增长趋势。方差分析结果表明,3—6月沙质和淤泥质中总氮含量没有显著差异(P>0.05),7—11月沙质和淤泥质中总氮含量有显著差异(P<0.01)。沙质中总磷含量为(0.02±0.02)~(0.09±0.07)mg·g-1,淤泥质中总磷含量较高,为(0.50±0.02)~(0.72±0.04)mg·g-1,两种底质中总磷含量都呈先降后升趋势,在8月份达到最低点。(2)总体上看,上层底质中总氮、总磷含量略高于下层,无显著性差异(P>0.05)。(3)沙质、淤泥质中进水口总氮、总磷含量最低。总氮含量在排水口和中间区相差不大。调查前期和后期,中间区总磷含量均高于排水口,后期两区域磷含量差别较大。综合评价认为,沙质参池底质中氮磷含量低、变化小,可能更有助于海参的可持续健康养殖,淤泥质中氮磷含量较高,且随着养殖月份增加明显升高,作为水体中营养盐的主要来源,存在内源污染风险。 王会毅 宋洪旭 曹学彬 刘佳亮 姜云宁 曲善村 邢荣莲关键词:海参池塘 底质 氮 磷 内源污染 处理不平衡样本集的欠采样算法 被引量:7 2013年 支持向量机(SVM)在处理不平衡样本集时,对少类样本的分类效果很不理想。为提高支持向量机在处理不平衡问题上的分类效果,提出了一种核函数选取与欠采样相结合的算法,在提高少类样本准确率的前提下,将多类样本的分类准确率的损失降到最低。该方法首先基于特征空间的可分性选择最佳核函数,然后根据特征距离进行欠采样。基于UCI标准样本集的仿真实验结果表明了该算法是合理有效的。 丁福利 孙立民关键词:支持向量机 核函数