搜索到290篇“ 频繁模式增长“的相关文章
基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法
本发明公开了一种基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,将频繁模式树上路径的遍历转化为借助于蚁狮优化算法结合项头表在频繁模式树上路径的搜索,对搜索到的路径即关联规则利用适应度函数进行评估并保存,挖掘出最佳关...
叶志伟董达伟曹羽
应用基于密度聚类的频繁模式增长算法进行煤层气产能分析
2023年
由于传统的煤层气产能分析算法存在影响因素不够全面,运行效率低和人为设置聚类参数缺乏说服力的问题。因此,该文在煤层气产能分类的基础上,对分类结果进行回溯,挖掘煤层气产能影响因素的规律,将基于密度聚类算法(Density-Based Spatial Clustering of Application with Noise,DBSCAN)与频繁模式增长算法(Frequent-Pattern Growth,FP-Growth)关联度分析算法优化结合,提出新的基于DBSCAN的FP-growth煤层气产能分析模型,找出影响煤层气产能的关键因素及其对应的参数范围。该文是深度学习与煤层气开发交叉学科的应用与研究,致力于煤层气产能分析评价体系的构建,为提高煤层气单井产气量,提升措施选井的决策效率有积极影响。
吕茵王杨高永伟
关键词:DBSCAN聚类措施选井
基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法
本发明公开了一种基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,将频繁模式树上路径的遍历转化为借助于蚁狮优化算法结合项头表在频繁模式树上路径的搜索,对搜索到的路径即关联规则利用适应度函数进行评估并保存,挖掘出最佳关...
叶志伟董达伟曹羽
文献传递
一种增量式频繁模式增长数据挖掘方法
本发明涉及一种增量式频繁模式增长数据挖掘方法,包括1)将原数据库分成多个数据集,对每个数据集中各项的支持度计数进行并行计算;2)将原数据库中的数据进行分组,构建局部的频繁模式树,通过递归过程提取各局部的频繁项集;3)将各...
马云龙刘敏魏晓婷章锋楼灏亮
文献传递
动车组故障诊断知识挖掘中改进的并行频繁模式增长算法被引量:4
2016年
针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据挖掘算法。该算法在各主要步骤上均实现了并行处理,优化了局部频繁模式树生成规则,对频繁模式的搜索策略进行了改进。改进后的算法大大提高了关联规则挖掘的效率,挖掘结果很好地保留了故障信息与状态信息之间的关联关系,并合理去除了无效规则。通过对该算法的具体分析与实际测试,表明该算法在动车组故障诊断知识获取过程中具有快速、高效、准确的特点。
周斌徐文胜
关键词:故障诊断动车组MAPREDUCE
基于频繁模式增长算法的2型糖尿病患病风险预测的分析研究被引量:5
2016年
目的:分析基于频繁模式增长(FP-growth)算法的2型糖尿病患病风险预测,避免经典Apriori算法在2型糖尿病相关危险因素分析中执行效率低的缺陷。方法:选取兰州某医院医学信息科2009年1月至2014年3月的2型糖尿病患者的首次病程记录资料及其健康数据档案,根据2型糖尿病相关危险因素分析中的需要,引入更适用于2型糖尿病相关危险因素分析的FP-growth算法。采用C#语言对经典Apriori算法和FP-growth算法进行编程,对比分析两种算法的执行效率。结果:通过对比分析得到两种算法在运行时间与记录数据以及运行时间与支持度两个方面的对比值。结论:FP-growth算法在预测2型糖尿病相关风险因素的分析中执行效率更高,能够找到更多的糖尿病风险因素。
韦哲叶广健王能才
关键词:数据挖掘APRIORI算法关联规则频繁模式增长算法风险分析
一种增量式频繁模式增长数据挖掘方法
本发明涉及一种增量式频繁模式增长数据挖掘方法,包括1)将原数据库分成多个数据集,对每个数据集中各项的支持度计数进行并行计算;2)将原数据库中的数据进行分组,构建局部的频繁模式树,通过递归过程提取各局部的频繁项集;3)将各...
马云龙刘敏魏晓婷章锋楼灏亮
云制造环境下并行频繁模式增长算法优化被引量:5
2012年
针对云制造环境下的海量数据挖掘,分析了现有并行频繁模式增长算法的实现和不足。研究了利用键值存储系统对其中的计数和分组部分进行优化。利用键值型数据库存储简单、自动增长且有序的方式,将计数和分组的信息存储在了键值型数据库上。通过减少对分布式文件系统的读写,并将计数过程和排序过程并行化执行,优化后的算法减小了存储节点的网络及内存开销。在真实数据集上,通过实验对比了优化前后算法的性能以及对于文件系统I/O的开销。
王洁戴清灏曾宇杨东日
关键词:云制造数据挖掘
基于分布式协调系统的并行频繁模式增长算法的优化被引量:1
2012年
频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到并行环境中,以对海量数据进行挖掘。在Apache软件基金会的Mahout项目实现的基础上,对计数和排序阶段以及算法的执行顺序提出了新的优化策略。优化后的设计将计数信息存储在分布式协调系统上,充分地利用了分布式协调系统的高可用性、适宜存储元数据信息的特点。该设计减小了小文件在分布式文件系统(HDFS)上的开销,同时保留了其优点,还能使计数过程和排序过程并行执行,减小了计算节点的内存开销。对比了文件系统I/O的开销,并分析了实现设计中的难点,为未来的工作打下了基础。
王洁戴清灏李环
关键词:频繁模式增长算法并行数据挖掘
基于分布式协调系统的并行频繁模式增长算法的优化
频繁模式挖掘可以发现数据中频繁出现的模式,是关联规则挖掘的重要步骤。并行频繁模式算法将其应用到了并行环境中,以对海量数据进行挖掘。在APACHE软件基金会的MAHOUT项目的实现基础上,对计数和排序阶段以及算法的执行顺序...
关键词:频繁模式增长算法并行数据挖掘
文献传递网络资源链接

相关作者

马云龙
作品数:98被引量:98H指数:6
供职机构:同济大学
研究主题:恐慌 疏散 人群疏散 网络 并行化
周钦亮
作品数:3被引量:7H指数:1
供职机构:山东大学计算机科学与技术学院
研究主题:关联规则 频繁模式增长 数据挖掘 FP-TREE 关键字查询
刘敏
作品数:84被引量:24H指数:3
供职机构:同济大学
研究主题:网络 汽车零部件 并行化 通用夹具 聚类
章锋
作品数:23被引量:0H指数:0
供职机构:同济大学
研究主题:并行化 蚁群 信息素 蚂蚁 网络节点
魏晓婷
作品数:3被引量:0H指数:0
供职机构:同济大学
研究主题:频繁模式增长 数据项 数据挖掘方法 增量式 布尔矩阵