赵磊
- 作品数:1 被引量:5H指数:1
- 供职机构:南京邮电大学更多>>
- 发文基金:教育部重点实验室开放基金江苏省高校自然科学研究项目国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 结合朴素贝叶斯和欧氏距离的二类非均衡数据集成方法被引量:5
- 2017年
- 随着数据挖掘技术的发展,传统集成方法中的集成规则,例如Max rule,Min rule,Product rule,以及Sum rule,已经不能满足现实中对于二类非均衡数据分类正确率的需要。因此本文提出了基于朴素贝叶斯和欧氏距离的二类非均衡数据集成方法。该集成方法是以朴素贝叶斯为基分类器,其集成规则通过引入测试数据与训练数据之间的欧式距离以及训练数据中多数类与少数类之间的关系,在空间距离上加强了最终的分类结果与原始训练数据之间的关联性。实验结果表明,该集成方法在处理二类非均衡数据时,Area Under roc Curve(AUC)值与现存的集成方法相比显著提高,从而具有更好的分类性能。因此,本文方法在处理二类非均衡数据时具有明显优势。
- 王磊王磊赵磊
- 关键词:欧氏距离朴素贝叶斯