搜索到1629篇“ 序列模式挖掘“的相关文章
一种对比序列模式挖掘算法
2024年
对比序列模式挖掘作为序列模式挖掘领域的一个重要分支,可以有效识别不同类别间差异显著的模式,并被广泛应用在序列分类、特征提取等场景中.但传统的对比序列模式挖掘仅考虑了模式序列中是否出现,忽略了模式序列中的重复性;并且需要用户预先设置间隙约束值,导致算法的灵活性较差.为了解决上述问题,本文提出一次性条件下自适应对比序列模式挖掘算法OSCP,该算法采用逆向填充策略计算模式支持度,不仅关注了模式序列中的具体出现情况,还提高了算法的计算效率;同时采用模式连接策略以减少候选模式数量.此外,本文采用自适应间隙,无需用户预先设置间隙约束,可基于序列的实际特征计算模式的支持度.实验结果表明,OSCP算法的挖掘性能和分类效果均优于其他对比算法.
谢婷萱武优西王月华李艳
关键词:序列模式挖掘
一次性条件下的三支序列模式挖掘
2024年
一次性条件下的序列模式挖掘旨在从序列数据中挖掘出带有间隙约束的重复序列模式。然而,现有方法不考虑用户的兴趣度,将序列中的每个字符视作同等重要,导致许多用户不感兴趣的冗余模式被发现。为了解决这个问题,将三支决策思想引入序列模式挖掘领域,提出了一次性条件下的三支序列模式挖掘问题及其求解算法。在支持度计算方面,该算法基于深度优先搜索和回溯的策略,结合三支模式的特点以高效求解模式支持度。在候选模式生成方面,该算法采用模式连接策略缩减候选模式数量。此外,该算法还采用了并行化方案充分利用现代处理器的多核性能,提高算法的挖掘效率。最后,实验结果验证了研究一次性条件下的三支序列模式挖掘问题的意义和算法的高效性。
杨仕琦武优西耿萌李艳
关键词:序列模式挖掘
高效的一次性弱间隙序列模式挖掘算法
2024年
间隙约束序列模式挖掘作为序列模式挖掘的一个重要分支,可以发现模式序列中的重复出现。然而,当前研究主要针对单项序列进行挖掘,并且序列中每一项都被认为具有相同意义。为解决该问题,提出一次性弱间隙序列模式挖掘(OWP)算法,该算法由准备阶段、支持度计算和候选模式生成3个步骤组成。在准备阶段,建立倒排索引,并对不频繁的项进行剪枝;在支持度计算方面,利用倒排索引结构记录出现位置,避免对原始数据集的重复扫描;在候选模式生成方面,采用模式连接策略,减少冗余候选模式的生成。在项集序列和单项序列共6个真实数据集上的实验结果表明,OWP算法相比OWP-p、Ows-OWP和OWP-e算法在运行时间上分别提升了2.653、1.348、3.592倍,在内存消耗上分别减少了3.51%、0.07%、5%,说明OWP算法可以更高效地挖掘出用户感兴趣的模式。此外,OWP算法在以D1数据集为基础的6倍大小的数据集上的运行时间比D1数据集增长了3.763倍,内存消耗增长了2.310倍,运行时间和内存消耗的增加倍数均小于数据集大小的增加倍数,说明OWP算法具有良好的可扩展性。
杨鸿茜武优西耿萌刘靖宇李艳
关键词:序列模式挖掘
具有效率约束的序列模式挖掘方法、装置及设备
一种具有效率约束的序列模式挖掘方法、装置及设备,涉及数据挖掘领域,包括基于模式中项目的开始时间、结束时间、进度时间和总持续时间以及序列长度分别确定出出勤性约束、离散型约束和辍学性约束;根据出勤性约束、离散型约束和辍学性约...
唐昀峰彭亚威朱明沈振冈李艳红
一次性条件下top-k高平均效用序列模式挖掘算法
2024年
针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式
杨克帅武优西耿萌刘靖宇李艳
关键词:数据挖掘序列模式挖掘TOP-K
基于情境感知和序列模式挖掘的气象学习资源推荐算法被引量:1
2024年
随着互联网的快速发展,气象部门职工作为学习者可以获得的学习资源得到极大丰富。信息超载导致检索合适的在线学习资源时遇到了困难;学习者在不同学习环境和序列访问模式上也有不同的学习需求。但是,现有的推荐系统,如基于内容的推荐和协同过滤,没有结合学习者的情境和序列访问模式,推荐结果准确度不高。本文提出了一种结合情境感知、序列模式挖掘和协同过滤算法的混合推荐算法来为学习者推荐学习资源。混合推荐算法中,情境感知被用来整合学习者的情境信息,如知识水平和学习目标;序列模式挖掘被用来对网络日志进行挖掘,发现学习者的序列访问模式;协同过滤被用来根据学习者的情境数据和序列访问模式为目标学习者计算预测并生成建议。实验和应用效果表明,该混合推荐算法推荐的质量和准确性方面优于其他推荐算法。
王帅马景奕周远洋王甫棣
关键词:推荐系统情境感知协同过滤序列模式挖掘
一种基于数组存储的序列模式挖掘方法
本发明公开了一种基于数组存储的序列模式存储方法及挖掘方法,属于数据挖掘,要解决的技术问题在序列模式挖掘中保证如何在不损失挖掘速度的情况下,有效的节约存储空间;存储方法为对于每一个序列,设置一个存储数组,通过存储数组存储其...
胡庆顺任晓强
具有周期间隙约束的负序列模式挖掘被引量:1
2023年
间隙约束的序列模式挖掘是一种特殊形式的序列模式挖掘方法,该方法能够揭示一定间隔下的频繁出现(发生)的子序列。但当前间隙约束的序列模式挖掘方法只关注正序列模式挖掘,忽略了事件中的缺失行为。为解决该问题,探索了周期间隙约束的负序列模式(Negative Sequential Pattern with Periodic Gap Constraints,NSPG)挖掘方法,该方法能够更灵活地反映元素与元素之间的关系。为高效求解NSPG挖掘问题,提出了NSPG-INtree(Incomplete Nettrees)算法,该算法主要包括两个步骤:候选模式生成和支持度计算。在候选模式生成方面,为了减少候选模式的数量,该算法采用模式连接策略;在支持度计算方面,为了提高模式支持度计算效率并减少空间消耗,该算法采用不完整网树结构计算模式支持度。实验结果表明,NSPG-INtree算法不仅具有较高的挖掘效率,而且能同时挖掘间隙约束的正序列模式和负序列模式。与其他间隙约束的序列模式挖掘算法相比,NSPG-INtree能够多发现209%~352%的模式;与不同策略的对比算法相比,NSPG-INtree能够缩短6%~38%的运行时间。
王珠林武优西王月华刘靖宇
关键词:序列模式挖掘
数据流中负序列模式挖掘技术研究
随着大数据时代的不断发展,数据产生的速度不断加快,且随着时间实时变化。相较于传统静态数据,这类数据表现出流的形态,被称作数据流(DataStream)。由于数据流呈现连续、有序、快速、海量、变化等特点,使得传统负序列模式...
张楠楠
关键词:数据流
一种高效用序列模式挖掘方法及装置
本申请公开了一种高效用序列模式挖掘方法及装置,根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合;针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;将所述效用值不低于自身所对应的效用...
林浚玮张杰雄陈伟肖磊刘婷婷

相关作者

武优西
作品数:125被引量:302H指数:8
供职机构:河北工业大学
研究主题:序列模式挖掘 除法器 除数 二进制 加法器
胡学钢
作品数:504被引量:1,989H指数:21
供职机构:合肥工业大学
研究主题:数据挖掘 概念格 关联规则 粗糙集 属性约简
李艳
作品数:163被引量:1,166H指数:14
供职机构:河北工业大学经济管理学院
研究主题:序列模式挖掘 小鼠 计算机网络 影响因素 可持续发展
董祥军
作品数:122被引量:201H指数:8
供职机构:齐鲁工业大学
研究主题:负关联规则 数据挖掘 客户购买行为 数据库 置信度
胡孔法
作品数:216被引量:662H指数:12
供职机构:南京中医药大学
研究主题:联机分析处理 数据挖掘 OLAP 名老中医 XML