搜索到13883篇“ 聚类数“的相关文章
- 基于自组织的聚类算法及最佳聚类数的确定研究
- 戴清旭
- 基于类加权不稳定性的最佳聚类数确定方法
- 在数据分析方法中,聚类分析是数据处理的重要手段,它可以依据数据的相似特征对样本进行划分,挖掘数据中的潜在信息。聚类分析经过了几十年的研究,学者们提出了适用于不同数据结构的聚类算法和有效性指标,广泛应用于其他领域。数据集的...
- 顾鉴桥
- 关键词:聚类分析最佳聚类数
- 基于加权二分图的K均值最佳聚类数确定算法被引量:5
- 2023年
- 针对传统K均值算法无法精确预设初始聚类中心数目的问题,提出基于加权二分图的K均值最佳聚类数确定算法。设计等比例随机采样的方式,从原始大数据集中产生小数据集集合并从中产生聚类中心点点集,提高应对大规模数据集的能力;用聚类中心点点集形成二分图,针对聚类算法特性改进其赋权函数;设计评价数,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳聚类数。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模数据集能力。
- 林伟杰王勇周林
- 关键词:K均值初始聚类中心随机采样二分图最佳聚类数完美匹配
- 基于Python聚类分析的聚类数确定方法对比被引量:2
- 2023年
- 在大数据时代,机器学习被广泛应用于多个领域中。按学习方式分类可被分为监督学习、无监督学习以及强化学习等。其中,聚类方法是无监督学习的主要实现方式之一。聚类簇个数作为聚类算法中的重要参数之一,直接影响了最终聚类结果的准确性。文章以数字切片聚类为实际案例,讨论了2种确定聚类簇个数的方式。一种是显示的指定聚类簇个数,相关算法有k-means及高斯混合模型;另一种是由不同的超参数推断出聚类簇个数,相关算法有层次聚类及Louvain算法。对不同模型的拟合优度以及聚类结果进行了对比分析。
- 董芷欣
- 关键词:K-MEANS算法高斯混合模型层次聚类
- 一种自动识别聚类数的层次聚类算法
- 本发明提供一种自动识别聚类数的层次聚类算法,包括以下步骤:利用自然邻居搜索停止时所有数据点的反向邻居数最大值μ以及数据点μ近邻的欧式距离之和计算数据点的密度,设计一种通过手动输入参数控制噪声比例的动态噪声识别器来识别噪点...
- 龙建武王强
- 一种目标聚类数的获取方法、装置及计算机系统
- 本申请实施例公开了一种目标聚类数的获取方法、装置及计算机系统,其中所述方法包括:获取待分类数据集;对所述待分类数据集按照设定的至少两个聚类数分别进行聚类划分,获得所有所述聚类数对应的聚类划分结果;根据所述聚类数与所述对应...
- 李朋施斌彭虎孙迁
- 基于成对约束的SubKMeans聚类数确定算法
- 2021年
- 随着数据维度的增加,传统聚类算法会出现聚类性能差的现象.SubKMeans是一种功能强大的子空间聚类算法,旨在为K-Means类算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定聚类数目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系数进行结合,提出了一种基于成对约束的SubKMeans聚类数确定算法.改进后的轮廓系数能够更加准确的评价聚类性能,从而实现K值确定,实验结果证明该方法的有效性.
- 高波何振峰
- 关键词:子空间聚类聚类数
- 基于K-means算法的最佳聚类数研究被引量:15
- 2020年
- 针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采用K-means算法,针对K-means算法随机选择初始聚类中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始聚类中心,避免噪声点成为初始聚类中心,使得选择的初始聚类中心位于样本集稠密区域,Kmeans聚类的结果稳定有效。使用优化K-means算法和新的聚类有效性指标确定数据集的簇数,通过在UCI数据集和人工模拟数据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳的类数且算法运行速度快。
- 王艳娥梁艳司海峰丁心安
- 关键词:K-MEANS聚类数有效性指标聚类分析
- 聚类分析中的最佳聚类数确定方法研究
- 作为无监督学习方法的一种,聚类分析是从无标记数据集中获取信息和知识的重要手段,是数据挖掘、统计学、模式识别等领域的重要研究内容。通过有效的聚类分析,数据集的内在结构与特征可以被很好地发掘出来。随着数据挖掘和人工智能技术的...
- 张远翔
- 关键词:聚类分析最佳聚类数时间复杂度
- 文献传递
- 一种自动识别数据集中最佳聚类数的方法
- 本发明公开了一种自动识别数据集中最佳聚类数的方法,包括:在候选范围内各聚类数实例化K‑means后获得的质心基础上,通过平均畸变函数、质心、数据集以及0‑10正则化进行转换以及封装成数据对,利用反余弦函数对其进行进一步的...
- 石聪明黄永灿马靳鲜葛艳敏董晨沛宋旭柳翠寅刘应波梅盈
相关作者
- 周世兵

- 作品数:28被引量:411H指数:9
- 供职机构:江南大学物联网工程学院
- 研究主题:聚类有效性指标 聚类数 最佳聚类数 聚类分析 UML
- 诸克军

- 作品数:160被引量:947H指数:13
- 供职机构:中国地质大学经济管理学院
- 研究主题:遗传算法 软计算 模糊规则 人力资本 神经网络
- 徐振源

- 作品数:104被引量:540H指数:10
- 供职机构:江南大学理学院
- 研究主题:混沌系统 混沌 吸引子 MELNIKOV方法 同步化
- 周勇

- 作品数:284被引量:761H指数:15
- 供职机构:中国矿业大学
- 研究主题:网络 遥感图像 行人 图像 注意力
- 唐旭清

- 作品数:59被引量:537H指数:9
- 供职机构:江南大学理学院
- 研究主题:聚类分析 分层聚类 气候因子 结构聚类 粒度空间