广西高校重点实验室建设项目(GXSCIIP201201)
- 作品数:2 被引量:14H指数:2
- 相关作者:刘美玲汤卫东黄名选苏毅娟更多>>
- 相关机构:广西民族大学广西师范学院广西财经学院更多>>
- 发文基金:广西高校重点实验室建设项目广西民族大学科研项目广西高校科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于离散量优化初始聚类中心的k-means算法被引量:11
- 2017年
- 传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数目最多的聚类中选择离散量最大与最小的两个对象作为初始聚类中心,再根据最近距离将这个大聚类中的其他对象划分到与之最近的初始聚类中,直到聚类个数等于指定的k值。最后将这k个聚类作为初始聚类应用到k-means算法中。将提出的算法与传统k-means算法、最大最小距离聚类算法应用到多个数据集进行实验。实验结果表明,改进后的k-means算法选取的初始聚类中心唯一,聚类过程的迭代次数也减少了,聚类结果稳定且准确率较高。
- 刘美玲黄名选汤卫东
- 关键词:离散量K-MEANS聚类聚类中心
- 基于Apriori的Web访问模式挖掘算法被引量:3
- 2013年
- 简要介绍Apriori算法与Web访问路径的有向图表示方法,提出一种从Web日志文件中得到频繁访问模式的算法,该算法以Apriori算法为基础,并以访问路径序列的有序性特点作为候选集的剪枝策略,减少候选集的生成,提高算法的效率。在真实数据集和模拟数据集上分别进行实验,实验结果表明该算法是有效的,且适应性好。
- 刘美玲苏毅娟
- 关键词:数据挖掘频繁访问路径