国家自然科学基金(050504F)
- 作品数:5 被引量:27H指数:3
- 相关作者:胡学钢夏启寿方元康王德兴刘卫更多>>
- 相关机构:合肥工业大学池州学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- Web日志预处理中优化的会话识别方法被引量:14
- 2009年
- 针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
- 方元康胡学钢夏启寿
- 关键词:WEB挖掘数据预处理阈值会话识别
- 基于剪枝概念格模型的频繁项集表示及挖掘被引量:3
- 2007年
- 发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。
- 胡学钢刘卫王德兴
- 关键词:数据挖掘关联规则频繁项集概念格
- 改进的Web日志数据预处理技术被引量:5
- 2009年
- 介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。
- 方元康胡学钢夏启寿朱勇
- 关键词:WEB日志挖掘数据预处理会话识别
- 基于剪枝概念格的项集知识表示与挖掘被引量:5
- 2007年
- 在研究概念格和项集关系的基础上,将剪枝概念格模型引入数据库中项集的表示与挖掘,利用概念间的关系性质,在构造过程中及时、动态地剪枝,删除与项集求解无关的概念,不丢失信息的同时能有效压缩频繁项集的规模,实验证实了算法良好的性能。
- 胡学钢刘卫王德兴
- 关键词:数据挖掘关联规则项集概念格
- 基于框架网页与页面阈值的会话识别算法
- 2009年
- 会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
- 方元康胡学钢夏启寿朱勇
- 关键词:WEB挖掘数据预处理阈值会话识别