搜索到4832篇“ 频繁项集挖掘“的相关文章
一种基于Spark平台的并行化频繁挖掘方法
本发明提供一种基于Spark平台的并行化频繁挖掘方法,属于频繁模式挖掘领域,包括:Spark平台将原始数据划分为多个子数据并分布式存储于多个子节点,将各子节点存储的子数据转换为对应的布尔矩阵;通过合并重复事务对...
邓凡王佳斌吕晟林熙隆
图数据领域的频繁挖掘
2024年
本文对图数据中的频繁子图挖掘算法进行了综述。追溯了从传统非图数据频繁挖掘技术到图数据频繁子图挖掘的演化,详细阐述了经典算法如类Apriori方法和gSpan算法的原理与应用。也对近年来兴起的基于图表示学习的先进算法,如SPMiner、NSIC、LSS和NeurSC进行了系统的介绍和比较。本文不仅回顾了算法的历史演进,还对各类算法进行了详细的分析与讨论,通过分析这些算法的性能和特点,揭示了它们的优势与局限。最后,展望了图神经网络在频繁子图挖掘领域的未来发展方向,并指出了这些技术在生物网络分析、社交网络分析等领域应用的广阔前景。
邱文韬兰红
关键词:频繁项集挖掘频繁子图
频繁挖掘研究前沿及展望
2024年
频繁挖掘是数据挖掘领域的核心任务之一,其目标是发现在数据库中频繁出现的模式。这些模式对于关联规则、分类、异常检测等多个数据挖掘任务都具有重要作用。由于随着大小的增加,的组合数量呈指数级增长,导致计算复杂性急剧上升,研究人员一直在努力开发高效的算法来解决这一问题。面向频繁挖掘的算法、紧凑表示和前沿应用,深入探讨不同技术的的工作原理、优势和局限性,从而对这一领域的研究现状进行全面总结。最后,进一步探讨了该领域的前沿发展趋势,指出计算效率、基于约束的频繁挖掘、模式的可解释性以及算法在不同领域的创新应用等未来潜在研究方向。
张晴谭旭吕欣
关键词:频繁项集数据挖掘关联规则
基于线性表的动态容错频繁挖掘方法研究
容错频繁挖掘算法可以帮助用户发现数据之间更隐晦的关系,具有更广泛的适用性,但比精确频繁挖掘算法更具有挑战性,因为该算法允许容错频繁模式(Fault Tolerant Frequent Pattern:FT-Pat...
李星玥
关键词:频繁项集动态容错
一种数据频繁挖掘可用性评估方法
本发明公开了一种数据频繁挖掘可用性评估方法,所述方法包括步骤:(1)设C={I<Sub>1</Sub>,I<Sub>2</Sub>,…,I<Sub>n</Sub>}是合,给定事务数据D<Sub>1</Sub...
吴卓超
基于频繁挖掘的异常用电行为监测系统
2024年
由于在构建异常用电行为监测系统时,需要处理大量的异常数据,且取样参量存在相似性,增大计算量,导致监测能力较低。为提升电网主机对异常用电行为的监测能力,设计基于频繁挖掘的异常用电行为监测系统。根据频繁提取异常用电信号不确定数据,研究异常用电的行为特征,分析异常用电行为。根据电网监测规则与异常用电信号监测模块,实现监测功能,设计异常用电行为监测系统。实验结果表明,文中方法可以精准监测到第5 s时电路负荷发生的突增,说明该方法的监测结果可靠性较高。
李晓民魏爽王玉东
关键词:频繁项集挖掘耗电量
面向传感数据的多概率阈值频繁挖掘方法及装置
本发明公开了一种面向传感数据的多概率阈值频繁挖掘方法及装置,该方法包括:生成传感数据不确定事务数据库对应的1,获取按照其概率频繁阈值升序排列的可扩展1;将获取到的可扩展频繁1与其后续结合生成多个候选2...
贾丹阳郭浩王新宇宋曌王啸天尤涛
基于奇异值分解的本地差分隐私保护的频繁挖掘方法
本发明公开了基于奇异值分解的本地差分隐私保护的频繁挖掘方法,具体为:步骤1:频繁目频次估计;步骤2:服务器端利用步骤1中的频繁目频次估计的结果建立初始矩阵,对此矩阵进行奇异值分解,得到左右矩阵发送至用户端;步骤3...
董恺池平川
基于本地化差分隐私的频繁挖掘方法
本发明公开了一种基于本地化差分隐私的的频繁挖掘方法,包括以下步骤:步骤1:本地数据保护阶段:采用自适应的编码策略,根据编码后0/1串中每一位上0与1的情况,产生扰动参数数组,依据该扰动数组应用随即响应技术对数据进行扰...
倪巍伟吴尔立吴宁
基于Spark的并行频繁挖掘算法被引量:2
2023年
针对大数据环境下基于Spark的频繁模式增长(FP-Growth)算法存在创建条件频繁模式树(FP-tree)时空效率低,节点间通信开销大,以及冗余搜索等问题,提出了基于Spark的并行频繁挖掘算法(PAFMFI-Spark)。首先,该算法提出非负矩阵分解策略(SNMF),通过提供支持度计数查询和分解储存支持度计数的矩阵,解决了创建条件FP-tree的时空效率低的问题;其次,提出基于遗传算法的分组策略(GS-GA),均衡分配频繁1至各节点,解决了节点间的通信开销大的问题;最后,提出高效缩减树结构策略(ERTSS),缩减FP-tree树结构,解决了冗余搜索的问题。实验结果验证了PAFMFI-Spark算法的可行性以及相较于其他挖掘算法的性能优势,所提算法能有效适应各种数据的频繁挖掘
毛伊敏吴斌许春冬张茂省
关键词:大数据频繁模式增长算法非负矩阵分解

相关作者

陈凤娟
作品数:46被引量:24H指数:3
供职机构:辽宁对外经贸学院
研究主题:频繁项集 不确定数据 频繁项集挖掘 关联规则 条件信息熵
毛伊敏
作品数:108被引量:346H指数:9
供职机构:江西理工大学信息工程学院
研究主题:不确定数据 大数据 滑坡 MAPREDUCE 聚类算法
王红梅
作品数:83被引量:226H指数:7
供职机构:长春工业大学
研究主题:频繁项集 计算机专业 测试集 果胶酶 剪枝
黄龙军
作品数:111被引量:176H指数:8
供职机构:江西师范大学
研究主题:恶意程序 无线传感器网络 数据挖掘 信标节点 物联网
温磊
作品数:24被引量:23H指数:3
供职机构:华北电力大学经济与管理学院经济管理系
研究主题:关联规则 项集 频繁项集 数据挖掘 频繁集