搜索到13883篇“ 聚类数“的相关文章
基于自组织的算法及最佳的确定研究
戴清旭
基于加权不稳定性的最佳确定方法
据分析方法中,分析是据处理的重要手段,它可以依据据的相似特征对样本进行划分,挖掘据中的潜在信息。分析经过了几十年的研究,学者们提出了适用于不同据结构的算法和有效性指标,广泛应用于其他领域。据集的...
顾鉴桥
关键词:聚类分析最佳聚类数
基于加权二分图的K均值最佳确定算法被引量:5
2023年
针对传统K均值算法无法精确预设初始中心目的问题,提出基于加权二分图的K均值最佳确定算法。设计等比例随机采样的方式,从原始大据集中产生小据集集合并从中产生中心点点集,提高应对大规模据集的能力;用中心点点集形成二分图,针对算法特性改进其赋权函;设计评价,改进Kuhn-Munkres算法,将其用于求取二分图的最大权完美匹配,确定最佳。实验结果表明,相较其它6种对比算法,所提算法有更高的准确性,更好的稳定性,以及更强的处理大规模据集能力。
林伟杰王勇周林
关键词:K均值初始聚类中心随机采样二分图最佳聚类数完美匹配
基于Python分析的确定方法对比被引量:2
2023年
在大据时代,机器学习被广泛应用于多个领域中。按学习方式分可被分为监督学习、无监督学习以及强化学习等。其中,方法是无监督学习的主要实现方式之一。簇个作为算法中的重要参之一,直接影响了最终结果的准确性。文章以字切片为实际案例,讨论了2种确定簇个的方式。一种是显示的指定簇个,相关算法有k-means及高斯混合模型;另一种是由不同的超参推断出簇个,相关算法有层次及Louvain算法。对不同模型的拟合优度以及结果进行了对比分析。
董芷欣
关键词:K-MEANS算法高斯混合模型层次聚类
一种自动识别的层次算法
本发明提供一种自动识别的层次算法,包括以下步骤:利用自然邻居搜索停止时所有据点的反向邻居最大值μ以及据点μ近邻的欧式距离之和计算据点的密度,设计一种通过手动输入参控制噪声比例的动态噪声识别器来识别噪点...
龙建武王强
一种目标的获取方法、装置及计算机系统
本申请实施例公开了一种目标的获取方法、装置及计算机系统,其中所述方法包括:获取待分据集;对所述待分据集按照设定的至少两个分别进行划分,获得所有所述对应的划分结果;根据所述与所述对应...
李朋施斌彭虎孙迁
基于成对约束的SubKMeans确定算法
2021年
随着据维度的增加,传统算法会出现性能差的现象.SubKMeans是一种功能强大的子空间算法,旨在为K-Means算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系进行结合,提出了一种基于成对约束的SubKMeans确定算法.改进后的轮廓系能够更加准确的评价性能,从而实现K值确定,实验结果证明该方法的有效性.
高波何振峰
关键词:子空间聚类聚类数
基于K-means算法的最佳研究被引量:15
2020年
针对算法在实现的过程中需要预先设定最终目的问题,提出了基于同全部样本的内紧密度和间离差度的一种新有效性指标,通过该指标能够有效地确定据集的最佳。在确定最佳的过程中采用K-means算法,针对K-means算法随机选择初始中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始中心,避免噪声点成为初始中心,使得选择的初始中心位于样本集稠密区域,Kmeans的结果稳定有效。使用优化K-means算法和新的有效性指标确定据集的簇,通过在UCI据集和人工模拟据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳的且算法运行速度快。
王艳娥梁艳司海峰丁心安
关键词:K-MEANS聚类数有效性指标聚类分析
分析中的最佳确定方法研究
作为无监督学习方法的一种,分析是从无标记据集中获取信息和知识的重要手段,是据挖掘、统计学、模式识别等领域的重要研究内容。通过有效的分析,据集的内在结构与特征可以被很好地发掘出来。随着据挖掘和人工智能技术的...
张远翔
关键词:聚类分析最佳聚类数时间复杂度
文献传递
一种自动识别据集中最佳的方法
本发明公开了一种自动识别据集中最佳的方法,包括:在候选范围内各实例化K‑means后获得的质心基础上,通过平均畸变函、质心、据集以及0‑10正则化进行转换以及封装成据对,利用反余弦函对其进行进一步的...
石聪明黄永灿马靳鲜葛艳敏董晨沛宋旭柳翠寅刘应波梅盈

相关作者

周世兵
作品数:28被引量:411H指数:9
供职机构:江南大学物联网工程学院
研究主题:聚类有效性指标 聚类数 最佳聚类数 聚类分析 UML
诸克军
作品数:160被引量:947H指数:13
供职机构:中国地质大学经济管理学院
研究主题:遗传算法 软计算 模糊规则 人力资本 神经网络
徐振源
作品数:104被引量:540H指数:10
供职机构:江南大学理学院
研究主题:混沌系统 混沌 吸引子 MELNIKOV方法 同步化
周勇
作品数:284被引量:761H指数:15
供职机构:中国矿业大学
研究主题:网络 遥感图像 行人 图像 注意力
唐旭清
作品数:59被引量:537H指数:9
供职机构:江南大学理学院
研究主题:聚类分析 分层聚类 气候因子 结构聚类 粒度空间