施潇潇
- 作品数:4 被引量:52H指数:3
- 供职机构:中山大学更多>>
- 发文基金:国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于网格技术的梅森素数搜索被引量:4
- 2008年
- 梅森素数是一种特殊的素数,它一直是数学研究的热点和难点。由于梅森素数搜索的计算复杂性,2300多年来人类仅发现了44个梅森素数。随着互联网与分布式计算技术的发展,利用网格技术寻找梅森素数成为了当今科学研究的热门课题。本文介绍了梅森素数的相关理论,并探讨了基于网格技术的梅森素数搜索的算法和应用,并介绍了梅森素数搜索的重要意义。
- 施潇潇陈晓东
- 关键词:网格技术素数梅森素数
- 主动迁移学习模型的研究与应用
- 分类是数据挖掘领域的一个重要技术。在数据独立同分布的假设下,分类技术根据已有的带有类别标签的训练样本建立分类模型,并利用该模型尽量准确地对新的数据样本进行预测与分类。但是在实际应用中,满足独立同分布条件的训练样本往往相当...
- 施潇潇
- 关键词:数据挖掘
- 文献传递
- 一种改进的基于特征赋权的K均值聚类算法被引量:17
- 2006年
- 聚类分析是数据挖掘及机器学习领域内的重点问题之一。近年来,为了提高聚类质量,借鉴和引入了分类领域特征选择及特征赋权思想,提出了一些基于特征赋权的聚类算法。在这些研究基础上,本文提出了一种基于密度的初始中心点选择算法,并借鉴文[1]所提出的特征赋权方法,给出了一种改进的基于特征赋权的K均值算法。实验表明该算法能较为稳定地得到较高质量的聚类结果。
- 任江涛施潇潇孙婧昊黄焕宇印鉴
- 关键词:聚类初始化
- 一种用于文本聚类的改进的K均值算法被引量:29
- 2006年
- K均值算法是聚类分析中使用最为广泛的算法之一。针对文本聚类所面临的维数灾难,稀疏向量以及标准K均值算法初始中心点选择的随机性等问题,提出了一种面向文本聚类的改进的K均值算法,通过运用特征选择及降维、稀疏向量筛除、基于密度及散布的初始中心点搜索等方法进行改进。实验结果表明,改进后的算法无论在聚类精度还是在稳定性等方面,都明显优于标准的K均值算法。
- 任江涛孙婧昊施潇潇黄焕宇印鉴
- 关键词:文本聚类初始化