浙江省自然科学基金(LQ13G020008)
- 作品数:1 被引量:3H指数:1
- 相关作者:郭飞鹏卢琦蓓更多>>
- 相关机构:浙江经贸职业技术学院浙江工商大学台州职业技术学院更多>>
- 发文基金:浙江省自然科学基金浙江省教育厅科研计划教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进型FP-Tree的分布式关联分类算法被引量:3
- 2014年
- 传统的信息挖掘技术已经无法满足大数据环境下日益复杂的应用需求,而分布式数据挖掘技术是解决这个难题的一种手段,因此提出了基于改进型频繁模式树(FP-Tree)的分布式关联分类算法。首先,在各局部节点优化FP-Tree,生成局部条件模式树(CFP-Tree),再通过各节点间传送CFP-Tree构建全局CFP-Tree;其次,在挖掘全局CFP-Tree时通过计算显著度来获取初始的全局显著分类规则;最后,利用剪枝策略选取一个较小规则集来构造全局的关联分类器。实验结果表明该算法能够有效降低网络通信量,提高信息挖掘效率,同时保证剪枝的质量和规则的统计显著性,提高分类的精确性。
- 卢琦蓓郭飞鹏
- 关键词:频繁模式树