王斌
- 作品数:2 被引量:7H指数:2
- 供职机构:东华大学计算机科学与技术学院更多>>
- 发文基金:上海市科学技术委员会资助项目更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 一种基于BUC的水平加权关联规则挖掘算法被引量:2
- 2008年
- 关联规则挖掘可以从大量数据中发现项集间潜在而有趣的相互联系。针对用户对每个项目感兴趣的程度不同,一些学者提出了水平加权关联规则。然而每次生成新候选集后对整个数据库事物的扫描成为算法效率的一大瓶颈。为进一步提高加权关联规则的挖掘效率,在原有的水平加权关联规则算法的基础上,采取了深度优先的策略,提出了一种基于BUC的水平加权关联规则挖掘算法——BUC-MINWAL。改进算法可以大大减少对数据库的扫描范围。实验结果表明,改进的算法有更好的执行效率。
- 王斌丁祥武
- 关键词:数据挖掘加权关联规则
- 一种基于ID3的前剪枝改进算法被引量:5
- 2008年
- ID3算法作为一种流行的决策树算法,因为其算法简单、易实现而被广泛使用。但其生成的树结构往往过于庞大,复杂,也影响了算法效率。为了优化树的结构,提高树生成的效率,避免"过拟合"效应,本文将每个分类属性分类后的效果也考虑在内,即,若分类效果达到某个预定的标准则终止那条分支继续分类,并引入了最大支持度的概念,采用了前剪枝策略,对ID3算法进行了改进。实验结果显示,改进算法的确能够使生成的决策树在保证精度的基础上更加精简。
- 丁祥武王斌
- 关键词:数据挖掘决策树