沈亮亮
- 作品数:5 被引量:3H指数:1
- 供职机构:广西大学计算机与电子信息学院更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向不完备数据的改进C4.5算法研究被引量:2
- 2018年
- 大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。
- 沈亮亮蒙祖强张兵郭英明
- 关键词:不完备数据C4.5算法
- 基于局部密度和纯度的自适应k近邻算法
- [目的]针对K最近邻(K-Nearest Neighbor,KNN)算法中k 值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k 值。[方法]引入k 的可信度的概念,提出一种基于局部密度和纯度的自适应选取...
- 张兵蒙祖强沈亮亮李虹利
- 关键词:KNN分类
- 基于局部密度和纯度的自适应k近邻算法被引量:1
- 2017年
- 【目的】针对K最近邻(K-Nearest Neighbor,KNN)算法中k值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k值。【方法】引入k的可信度的概念,提出一种基于局部密度和纯度的自适应选取k值的方法,并将其引入到传统的KNN分类算法中。【结果】该算法合理的考虑了样本的局部密度、纯度与选取k值的关系,不仅解决了k值的选取问题,并且避免了固定k值对分类的影响。【结论】该算法是有效的,可以得到较高的准确率,但算法的时效性有待提高。
- 张兵蒙祖强沈亮亮李虹利
- 关键词:KNN分类
- 运用自适应粒化模型的一种数据分类方法
- 2018年
- 数据分类是一种重要的数据分析技术,但数据分类方法大多涉及诸多人为参数优化问题.在现今复杂数据环境下,事先获取数据的有关先验知识是一件比较难的事情,这给解决参数优化问题带来困难,限制了数据分类方法的应用范围.因此,如何构造无需参数优化的自适应分类方法是数据分类研究领域中面临的一项重要课题.本文构造一种自适应粒化模型并据此提出一种自适应数据分类方法.该方法以数据对象为中心,充分利用数据之间蕴含的相容关系,通过相容半径的自动优化来构造自适应粒化模型,然后基于此模型,通过数据对象的约简和对象规则的简化来构造分类器.整个分类方法完全是由数据驱动的,不需要任何先验知识和手工参数优化,实现了对数据的自适应分类.最后,通过实验验证了所提出方法的有效性.
- 蒙祖强沈亮亮甘秋玲覃华
- 关键词:数据分类自适应分类器粒化
- 基于局部密度和纯度的自适应k近邻算法
- 【目的】针对KNN算法中k值的选取通常是人为设定,而且通常是固定的缺点,研究如何更好地选取k值。【方法】引入了k的可信度的概念,提出了一种基于局部密度和纯度的自适应选取k值的方法,并将其引入到传统的KNN分类算法中。【结...
- 张兵蒙祖强沈亮亮李虹利
- 关键词:KNN分类
- 文献传递