湖南省博士后科研资助专项计划项目(2008RS4005)
- 作品数:5 被引量:16H指数:1
- 相关作者:文益民王耀南李健吕宝粮陈义明更多>>
- 相关机构:湖南大学湖南工程职业技术学院湖南工业职业技术学院更多>>
- 发文基金:湖南省博士后科研资助专项计划项目国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于字符级特征的日文依存句法自动分析算法
- 2009年
- 基于字符在词位的特定性位置能起标志性作用,使用反映日语的语言倾向性的特征分析依存句法,给出基于字符级特征的依存句法自动分析算法。该算法使用词首的头2个字符、词尾的最后1个字符以及词尾的最后2个字符这3种类型的字符级特征加强分析器的学习。采用第1种类型的特征,反映日语的词汇形态特点,采用后2种类型的特征,则部分反映了日语表达重心后置的语言特性。在CoNLL-2009日语语料库上进行实验以及进行实际评估,结果表明:与基线特征相比,该算法有效地提高分析器的UAS指标(即无标记依存关系的正确率)和LAS指标(即考虑带标记的依存关系的正确率),大大提高分析器的竞争力。
- 文益民赵海李健黄晗文
- 关键词:计算机应用依存句法分析
- 集成学习算法在不平衡分类中的应用研究
- 2009年
- 提出一种基于训练集分解的不平衡分类算法,该算法使用能输出后验概率的支持向量机作为分类器,使用基于测度层次信息源合并规则实现分类器的集成。在4个不同领域的不平衡数据集上的仿真实验表明:该算法有效提高分类器对正类样本的正确率,同时尽量减少对负类样本的误判。实验结果验证集成学习算法处理不平衡分类问题的有效性。
- 文益民李健杜飞明陈方
- 支持向量机处理大规模问题算法综述被引量:14
- 2009年
- 支持向量机在处理大规模问题时存在训练时间过长和内存空间需求过大的问题。分析了支持向量机在处理大规模问题时存在的局限性;对利用支持向量机处理大规模问题的各种算法进行了分类,并对每种算法的研究状况进行了较全面而深入的综述;对该领域内值得进一步研究的问题进行了讨论。
- 文益民王耀南吕宝粮陈义明
- 关键词:支持向量机
- 基于分类面拼接的快速模块化支持向量机研究被引量:1
- 2009年
- 针对大多数现有的机器学习算法处理大规模问题时需要的训练时间很长和存储空间很大的难点,提出了基于分类面拼接的快速模块化支持向量机算法(psfm-SVMs).在训练阶段,psfm-SVMs采用一簇平行超平面对大规模问题实施软划分,然后针对每个子问题并行训练支持向量机.在测试阶段,测试样本坐落于哪个子问题所在空间中,就由该子问题训练的支持向量机给出判别结果.在4个大规模问题上的实验表明:与采取硬划分的快速模块化支持向量机(fm-SVMs)相比,软划分能够使psfm-SVMs得到更加光滑的分类面,因而ps-fm-SVMs的泛化能力较高.在不增加训练时间的条件下,psfm-SVMs减少了由于训练集分割导致的分类器泛化能力下降.
- 文益民王耀南张莹
- 关键词:并行处理系统支持向量机模块化
- 基于训练集平行分割的集成学习算法研究被引量:1
- 2009年
- 针对大规模数据分类中训练集分解导致的分类器泛化能力下降问题,提出基于训练集平行分割的集成学习算法.它采用多簇平行超平面对训练集实施多次划分,在各次划分的训练集上采用一种模块化支持向量机网络算法训练基分类器.测试时采用多数投票法对各个基分类器的输出进行集成.在3个大规模问题上的实验表明:在不增加训练时间和测试时间的条件下,集成学习在保持分类器偏置基本不变的同时有效减少了分类器的方差,从而有效降低了由于训练集分割导致的分类器泛化能力下降.
- 文益民王耀南
- 关键词:并行处理系统