中南林业科技大学青年科学基金(2008041B)
- 作品数:2 被引量:5H指数:1
- 相关作者:辛动军邝祝芳阳国贵杨卫民谭骏珊更多>>
- 相关机构:中南林业科技大学国防科学技术大学更多>>
- 发文基金:中南林业科技大学青年科学基金高层次人才科研启动基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于渐增最小支持度函数的数据流频繁项挖掘被引量:1
- 2008年
- 目前数据流频繁项近似挖掘算法大多采用误差参数控制挖掘的结果,时间与内存开销越高,挖掘结果的正确性越低.针对这样一个问题,提出了渐增最小支持度函数作为误差参数.如果某数据项在滑动窗口中的保存时间越长,则该数据项的出现频率必须相应的增加才能继续保存在滑动窗口中.这样,在滑动窗口中需要保存的数据项的数量将减少,时间开销与内存开销也相应的减少.在此基础上,提出了一种基于渐增最小支持度函数的数据流频繁项挖掘算法GFFPM.该算法能准确的挖掘出滑动窗口中的频繁项.实验结果表明,该算法具有很高的正确性.
- 邝祝芳谭骏珊杨卫民辛动军
- 关键词:数据流数据挖掘频繁项
- SWFPM:一种有效的数据流频繁项挖掘算法被引量:4
- 2009年
- 分析了数据流频繁项挖掘算法EC的不足之处,如不能准确地挖掘最近一段时间内数据流的频繁项。提出了一种频繁项样本特征复合四元组的数据结构来保存样本集合,在此基础上,提出了一种基于滑动窗口的数据流频繁项挖掘算法——SWFPM。该算法能准确地挖掘出该滑动窗口中的频繁项。实验数据采用IBM合成数据发生器产生的顾客购物数据和1998年世界杯官方网站的访问日志数据。实验结果表明,该算法具有很高的频繁项挖掘准确度、快速的数据处理能力。
- 邝祝芳阳国贵辛动军
- 关键词:数据流数据挖掘频繁项
- 基于渐增最小支持度函数的数据流频繁项挖掘
- 目前数据流频繁项近似挖掘算法大多采用误差参数控制挖掘的结果,时间与内存开销越高,挖掘结果的正确性越低.针对这样一个问题,提出了渐增最小支持度函数作为误差参数.如果某数据项在滑动窗口中的保存时间越长,则该数据项的出现频率必...
- 邝祝芳谭骏珊杨卫民辛动军
- 关键词:数据流数据挖掘频繁项
- 文献传递