姚文集
- 作品数:4 被引量:8H指数:2
- 供职机构:北京工业大学计算机学院更多>>
- 发文基金:国家自然科学基金北京工业大学博士启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于滑动窗口的XML数据流的聚类算法研究与实现
- XML是一种用于数据交换和共享的自描述语言,已经成为互联网上数据表示和数据交换的标准。在数据传输及交换过程中,许多结构化或半结构化数据都以XML格式来表示,由此产生了大量的XML数据。该数据是一种按时间顺序无限到达的实时...
- 姚文集
- 文献传递
- XML数据流中面向聚类的指数直方图被引量:1
- 2011年
- 为了实现XML(extensible markup language)数据流的在线动态聚类,提出一种XML聚类特征指数直方图.该结构以XML时间聚类特征为基础,遵循指数直方图的维护规律.采用该结构的聚类算法在真实和模拟数据集上的实验结果说明:这一结构在聚类质量上可以达到甚至超过静态聚类方法;直方图个数固定时,内存开销基本稳定.
- 高明霞姚文集毛国君
- 同构XML流层次分类研究被引量:2
- 2010年
- 针对XML流的分类,本文提出了一种基于滑动窗口的方法,它以相同的SCHEMA为前提,以VFDT算法为核心,结合层次分类的思想,在文档中每一个内部节点处构建对应的分类器。通过与采用ID3算法对XML文档进行层次分类的结果对比,本文实验结果表明,该方法对XML流上数据进行分类的精确度能够达到XML静态分类的要求。
- 李广奎高明霞毛国君姚文集
- 关键词:XML数据流分类器
- 基于滑动窗口的XML数据流聚类算法被引量:5
- 2010年
- 通过对XML数据流的聚类研究,提出一种基于滑动窗口的XML数据流聚类算法SW-XSCLS。该算法采用滑动窗口技术,以聚类特征指数直方图作为概要数据结构,能动态地淘汰"过时"的数据,较好地保存当前窗口内的数据分布状况,从而获取较高质量的聚类结果。理论分析和实验结果表明,该算法可以获得较高的聚类质量和较快的处理速度。
- 姚文集高明霞毛国君李广奎
- 关键词:XML数据流聚类