搜索到717篇“ 最大频繁项集挖掘“的相关文章
海量数据最大频繁挖掘算法设计与实现
安宇
基于连通度的最大频繁挖掘方法
随着计算机和因特网技术的迅猛发展,从各种各样应用中收到的数据量越来越庞大,从海量数据中挖掘出有价值的信息和知识已经成为数据挖掘研究领域中的重要任务之一。针对当前最大频繁挖掘方法挖掘效率不高的问题,提出一种基于连通度...
郭鹏孙允明
文献传递
基于质数理论的最大频繁挖掘研究
2021年
利用质数的特性,采用质数积代替事务将事务,数据库转换成质数积数据,采用数据二维数组保存质数积之间的整除关系和最大公约数信息。PNMax算法利用数据二维数组可以快速挖掘最大频繁,并且数据二维数组在挖掘过程中将持续减少所占空间。最后通过实验验证了算法的可行性和优越性。
王利军
关键词:质数
基于H--struct的最大频繁挖掘算法研究
最大频繁挖掘是数据挖掘重要研究方向,它以频繁簇的最简合形式反映事务数据间的关联关系,具有重要的理论研究价值与应用前景。然而,大多数现有最大频繁挖掘算法更适于稠密数据。但实际应用中,存在着大量的事务模式...
孟洛
关键词:数据挖掘最大频繁项集邻接矩阵
文献传递
最大频繁挖掘算法的研究
随着信息技术的高速发展,各行各业所产生的数据量呈爆炸式增长,但是与之相反的是人们在预测行业前景的时候却不能参考足够的、有价值的规律。所以,从海量数据中挖掘出有价值的信息成为了目前的一个研究热点。数据挖掘是当前人工智能和数...
张昌
关键词:关联规则最大频繁项集
文献传递
基于B-list的最大频繁挖掘算法被引量:4
2019年
针对现有的最大频繁挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小搜索空间;最后再结合基于MFI-tree的投影策略实现超检测来提高算法的效率。实验结果表明,BMFI算法在时间效率与空间效率方面均优于FPMAX与MFIN算法。该算法在稠密数据与稀疏数据中进行最大频繁挖掘时均有良好的效果。
张昌文凯郑云俊
关键词:最大频繁项集挖掘深度优先搜索剪枝技术
一种基于邻接表的最大频繁挖掘算法被引量:15
2019年
针对Apriori算法与FP-Growth算法在最大频繁挖掘过程中存在的运行低效、内存消耗大、难以适应稠密数据的处理、影响大数据价值挖掘时效等问题,该文提出一种基于邻接表的最大频繁挖掘算法。该算法只需遍历数据库一次,同时用哈希表对邻接表进行辅助存储,减小了遍历的空间规模。理论分析与实验结果表明,该算法时间与空间复杂度较低,提高了最大频繁挖掘速率,尤其在处理稠密数据时具有较好的优越性。
殷茗王文杰张煊宇姜继娇
关键词:频繁项集APRIORIFP-GROWTHFP-TREE
一种基于邻接表的最大频繁挖掘方法
本发明涉及一种基于邻接表最大频繁挖掘方法,同时借助了邻接表和哈希表结合的存储方式,以减少数据库的扫描次数和遍历的空间规模,并可以尽早修剪掉小于支持度阈值的,避免生成较长最大频繁的所有非空子。该方法充分利用建...
殷茗王文杰蒋丹张煊宇曹宏业穆瑞杨益吴瑜
文献传递
基于DiffNodeset结构的最大频繁挖掘算法被引量:5
2018年
在数据挖掘中,通过挖掘最大频繁来代替挖掘频繁可以大大地提升系统的运行效率。针对现有的最大频繁挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁挖掘算法(MAFIA)中所使用的超检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据中进行最大频繁挖掘时均有良好的效果。
尹远尹远文凯文凯
关键词:最大频繁项集挖掘关联规则集合枚举树
基于连通度的最大频繁挖掘方法
随着计算机和因特网技术的迅猛发展,从各种各样应用中收到的数据量越来越庞大,从海量数据中挖掘出有价值的信息和知识已经成为数据挖掘研究领域中的重要任务之一。针对当前最大频繁挖掘方法挖掘效率不高的问题,提出一种基于连通度...
郭鹏孙允明
文献传递

相关作者

陈晓云
作品数:60被引量:162H指数:7
供职机构:兰州大学信息科学与工程学院
研究主题:数据挖掘 聚类算法 复杂网络 社团 最大频繁项集
任家东
作品数:136被引量:347H指数:10
供职机构:燕山大学
研究主题:数据挖掘 软件漏洞 聚类 漏洞检测 入侵检测方法
张进
作品数:4被引量:0H指数:0
供职机构:解放军信息工程大学
研究主题:炒作 最大频繁项集挖掘 事务数据库 事务 业务流
马志新
作品数:31被引量:155H指数:7
供职机构:兰州大学
研究主题:数据挖掘 最大频繁项集 剪枝策略 搜索空间 频繁项集
宋威
作品数:101被引量:654H指数:13
供职机构:北方工业大学
研究主题:数据挖掘 粗糙集 关联规则 属性约简 频繁项集