辽宁省自然科学基金(9910200205)
- 作品数:4 被引量:62H指数:4
- 相关作者:王天然王晓峰赵越更多>>
- 相关机构:中国科学院沈阳化工学院沈阳化工大学更多>>
- 发文基金:辽宁省自然科学基金辽宁省教育厅高等学校科学研究项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 一种自顶向下挖掘长频繁项的有效方法被引量:38
- 2004年
- Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问题 采用了一种新的自上而下挖掘方法 ,提出了事务项目关联信息表、关键项目、项目约简、投影数据库等新概念 ,利用投影、约简等方法在候选项集生成过程中及时修剪重复分支 ,使算法的实际效率大为提高 ,较好地解决了长频繁项的挖掘问题 通过计算机实验和算法分析证明了这种挖掘方法的有效性和完备性 新算法的计算复杂度与项目集平均约简项长度有关 ,估计为 0 5×M3 N×O(2 S×N′2 ) 其中 ,S为系统在用户给定最小支持度条件下的平均约简项长度 ,N′是数据库所对应关系的元组数 ,N为记录数 ,M为项目集平均长度 对于长频繁项来说S很小 。
- 王晓峰王天然赵越
- 关键词:自顶向下数据挖掘关联规则频繁项
- Apriori算法在红外光谱数据挖掘中的应用被引量:9
- 2001年
- 简要地介绍了在大规模数据库中挖掘关联规则的Apriori算法 ,给出了红外光谱数据库知识发现的空间表示方法 ,并根据红外光谱数据挖掘的特点改进了Apriori算法中支持度的计算与频繁集的确定过程 ,运用统计方法把挖掘结果形成可视的特征谱带 -化学基团规则式 ,通过具体的挖掘事例对挖掘结果进行分析与评价。挖掘出的规则式和波谱分析理论比较结果证明了挖掘结果的正确性 。
- 王晓峰王晓峰王天然尹丹娜
- 关键词:红外光谱APRIORI算法数据挖掘关联规则分析化学光谱分析
- 基于双空间搜索的频繁项挖掘方法被引量:10
- 2002年
- 1引言
1998年Roberto J.和Bayardo Jr.[7]利用自底向上搜索和项目集排序的方法建立了一种挖掘长型频繁项的Max-Miner算法;Lin D.和Z.Kedem[6]提出了一种双向钳形搜索Pincer-Search方法,利用自底向上搜索产生的非频繁项集来约束和修剪自顶向下方向的最大候选频繁项集,候选频繁项集来自于Apriori方法.这两种方法虽然细节有所不同,但修剪最大频繁项的思想类似.
- 王晓峰王天然
- 关键词:数据库数据挖掘数据结构
- 相关测度与增量式支持度和信任度的计算被引量:13
- 2002年
- 通过相关测度的定义,从理论上探讨了增量式规则发现问题,并把分类规则挖掘和关联规则挖掘联系起来进行研究,为该问题的深入研究奠定了理论基础.相关测度刻画了给定关系和相关集合的数字特征.对相关测度的概念、定义、性质以及与支持度和信任度的关系等方面作了详细的分析和探讨,给出了基于相关集合的支持度和信任度的定义及计算方法.证明了测度增量定理和支持度增量定理,并给出了增量式支持度和信任度的计算公式.另外还详细地分析了数据增量对关联规则和信任度的影响,探讨了基于新支持度的候选项的修剪问题.所提出的相关测度及其思想为研究既能用于分类规则又能用于关联规则的统一数据挖掘方法提供了有价值的新思路.
- 王晓峰王天然
- 关键词:信任度关联规则数据挖掘数据库