秦杨
- 作品数:3 被引量:13H指数:1
- 供职机构:中南大学商学院更多>>
- 发文基金:国家杰出青年科学基金国家科技重大专项国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于映射簇的Web数据挖掘研究被引量:1
- 2004年
- 传统特征选择算法在多维Web数据中由于其数据对象自身固有的稀缺性而常常失效。在典型多维Web数据挖掘应用中,不同数据对象集合对于不同维度集合而言可能聚类会更好,且在每个簇的具体子空间中维度数将可能非常大。事实上,为所有簇查找出单个的小维度集合是不可能的。本文应用映射簇的概念来明确簇与维度的关系,将聚类问题转化为映射簇问题,从而简化计算提高挖掘效率。最后给出相应的算法。
- 陈晓红秦杨
- 关键词:WEB数据挖掘聚类
- 基于决策支持的数据管理系统研究
- 信息时代数据的爆炸式增长,技术日新月异,日益复杂的决策环境和决策问题对决策支持系统提出了更高的要求。以数据仓库、联机分析处理和数据挖掘为代表的决策支持新技术的出现,为决策管理人员从数据中获取决策信息和知识提供了新的思路和...
- 秦杨
- 关键词:决策支持系统数据管理数据仓库联机分析处理软件设计
- 文献传递
- 基于Web数据挖掘的高效关联规则研究被引量:12
- 2005年
- 随着网络资源越来越丰富,Web数据挖掘逐渐成为因特网上资源有效利用的研究热点。本文提出通过对因特网上非结构化数据的XML格式进行筛选等处理,然后转化为结构化数据存储在SQL Server数据库中。并在此基础之上利用关联规则发现以生成最小关联规则集来代替完全关联规则集,就可以有效地剪除弱关联规则,大幅度地减少候选频繁项目集,从而提高规则发现效率。最后,在传统经典算法Apriori基础上,利用弱关联规则的向上关闭特性设计了一个相应的高效算法。
- 陈晓红秦杨
- 关键词:WEB数据挖掘数据仓库关联规则