张雯
- 作品数:3 被引量:16H指数:2
- 供职机构:山东师范大学信息科学与工程学院更多>>
- 发文基金:山东省教育厅科技计划山东省自然科学基金山东省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 决策树构建方法:向前两步优于一步被引量:1
- 2010年
- 为提高搜索算法找到全局最优解的可能性,在C4.5算法的基础上,本文提出了向前两步的决策树(two-step forward decision tree,TSFDT)构建算法。该算法在选择属性时,考虑同时选择两个属性带来的信息增益,而不是只考虑单一最优属性对于信息增益的贡献,从而在寻找问题全局最优方面比只考虑单一最优属性具有更大的可能性。10个UCI基准数据集上的实验结果表明,该算法明显优于C4.5算法。
- 张雯张化祥李明方计华
- 关键词:决策树信息增益C4.5算法
- 不平衡数据集的神经网络阈值优化方法被引量:2
- 2010年
- 不平衡数据集分类为机器学习热点研究问题之一,近年来研究人员提出很多理论和算法以改进传统分类技术在不平衡数据集上的性能,其中用阈值判定标准确定神经网络中的阈值是重要的方法之一。常用的阈值判定标准存在一定缺点,如不能使少数类及多数类分类精度同时取得最好、过于偏好多数类的精度等。为此提出一种新的阈值判定标准,依据该标准能够使少数类及多数类分类精度同时取得最好而不受样例类别比例的影响。以神经网络与遗传算法相结合训练分类器,作为阈值选择条件和分类器的评价标准,新标准能够得到较好的结果。
- 李明方张化祥张雯计华
- 关键词:不平衡数据集神经网络遗传算法
- 属性加权的朴素贝叶斯集成分类器被引量:13
- 2010年
- 为提高朴素贝叶斯分类器的分类精度和泛化能力,提出了基于属性相关性的加权贝叶斯集成方法(WEBNC)。根据每个条件属性与决策属性的相关度对其赋以相应的权值,然后用AdaBoost训练属性加权后的BNC。该分类方法在16个UCI标准数据集上进行了测试,并与BNC、贝叶斯网和由AdaBoost训练出的BNC进行比较,实验结果表明,该分类器具有更高的分类精度与泛化能力。
- 张雯张化祥
- 关键词:朴素贝叶斯分类器相关度属性加权ADABOOST