搜索到25651篇“ 划分聚类算法“的相关文章
基于划分算法的船舶实时能效分析
2024年
为了实现多因素影响下的船舶营运能效综合优化与提升,需要开展船舶能效数据的挖掘与分析,探索切实有效的船舶能效优化方法。以内河航运船舶作为研究对象,分析了船舶能效的主要影响因素,开展了船舶能效数据采集与分析,基于划分算法将船舶通航环境划分为不同等级,并在此基础上进行船舶实时能效数据分析,加快推广船舶实时能效在船舶运营中的应用,为提高内河船舶的能效水平提供理论方法与技术支持。
易加宁徐士甲
关键词:内河船舶划分聚类数据分析
划分算法的改进研究
K-means算法和模糊C均值算法是经典的基于划分算法。该算法简单易懂,易于实现,可以发现具有清晰边界的簇,在现实生活中得到了广泛的应用。然而,该算法存在明显的局限性,包括初始簇中心的敏感性、过程中容易陷入...
郭凯
密度峰值算法划分算法的研究
算法在数据挖掘中一直有着很高的地位,与分算法不同,是一种无需事先知道数据具体特点的算法,也就是无监督算法。由于算法能快速从繁杂的数据集中提取出有用的信息,使得该算法在一些领域发挥着巨大作用,如图像分割,语音...
向驰
关键词:数据挖掘划分聚类算法
基于层次划分算法的BTS算法研究被引量:1
2022年
BTS(Best Two Step)算法是结合层次划分算法的两步算法。层次算法之间不可以对象交换,很容易造成质量不高的结果。而划分对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的效果。
刘康明艾鸽张宇傅毓
关键词:层次聚类划分聚类
自适应密度划分算法的优化研究
密度峰值算法是一种基于密度划分算法,与传统的算法相比具有简单高效、对噪声不敏感、能准确找出中心以及快速分配样本点等优势,近些年广受研究人员的关注。但其本身也存在一定的缺陷,本文针对密度峰值算法在计算...
纪耀立
关键词:相对密度最小生成树
基于Spark框架和ASPSO的并行划分算法被引量:8
2022年
针对划分算法处理海量的数据存在的数据离散系数较大与抗干扰性差、局部簇簇数难以确定、局部簇质心随机性及局部簇并行化合并效率低等问题,提出了一种基于Spark框架和粒子群优化自适应策略(ASPSO)的并行划分(PDC-SFASPSO)算法。首先,提出了基于皮尔逊相关系数和方差的网格划分策略获取数据离散系数较小的网格单元并进行离群点过滤,解决了数据离散系数较大与抗干扰性差的问题;其次,提出了基于势函数与高斯函数的网格划分策略,获取局部的簇数,解决了局部簇簇数难以确定的问题;再次,提出了ASPSO获取局部簇质心,解决了局部簇质心的随机性问题;最后,提出了基于簇半径与邻居节点的合并策略对相似度大的簇进行并行化合并,提高了局部簇并行化合并的效率。实验结果表明,PDC-SFASPSO算法在大数据环境下进行数据的划分具有较好的性能表现,适用于对大规模的数据集进行并行化
毛伊敏甘德瑾廖列法陈志刚
关键词:网格划分
基于MapReduce和改进密度峰值的划分算法被引量:7
2021年
对于基于划分算法随机选取初始中心导致初始中心敏感,结果不稳定、集群效率低等问题,提出一种基于MapReduce框架和改进的密度峰值的划分算法(based on MapReduce framework and improved density peak partition clustering algorithm,MR-IDPACA)。首先,通过自然最近邻定义新的局部密度计算方式,将搜索样本密度峰值点作为划分算法的初始中心;其次针对算法在大规模数据下运行时间复杂,提出基于E2LSH(exact Euclidean locality sensitive hashing)的一种分区方法,即KLSH(K of locality sensitive hashing)。通过该方法对数据分区后结合MapReduce框架并行搜寻初始中心,有效减少了算法在搜索初始中心时的运行时间;对于MapReduce框架中的数据倾斜问题,提出ME(multistage equilibrium)策略对中间数据进行多段均衡分区,以提升算法运行效率;在MapReduce框架下并行,得到最终结果。实验得出MR-IDPACA算法在单机环境下有着较高的准确率和较强的稳定性,集群性能上也有着较好的加速比和运行时间,效果有所提升。
黄学雨向驰陶涛
关键词:划分聚类算法MAPREDUCE
基于MapReduce和改进人工蜂群算法的并行划分算法被引量:6
2021年
针对大数据背景下基于划分算法中存在参数寻优能力不佳、初始中心敏感、数据倾斜等问题,提出一种基于MapReduce和人工蜂群(artificial bee colony,ABC)算法的并行划分(the partitioning-based clustering algorithm by using improve artificial bee colony based on MapReduce,MR-PBIABC)算法。首先,提出基于反向学习和准则函数的初始化策略(backward learning and the clustering criterion function,BLCCF),提升人工蜂群算法搜索的解质量,并将ABC算法和人工鱼群(artificial fish colony,AFS)算法结合,提出改进人工蜂群(improve artificial bee colony,IABC)算法,通过利用AFS算法最优解能力较强的特性,来提高ABC算法的寻优能力;其次,根据改进的人工蜂群算法IABC获取初始中心,提出相对熵策略(relative entropy strategy,RES)衡量人工鱼间的距离,保证获得的初始中心是最优人工鱼状态,从而有效避免了随机选取初始中心,引起的初始中心敏感的问题;再次,设计数据均衡策略(data balancing strategy,DBS),通过动态收集节点负载并分配节点间的负载,解决了节点上数据倾斜的问题;最后,结合MapReduce计算模型,并行挖掘簇中心,生成最终结果。实验结果表明,MR-PBIABC算法效果更佳,同时在大数据环境下,能有效地提高并行计算的效率。
陶涛毛伊敏
关键词:MAPREDUCE
Canopy在划分算法中对K选取的优化被引量:13
2020年
针对划分算法数K的取值工作量较大的问题,提出一种新的Canopy+算法.该算法可实现对个数K的预判,在保证准确率的前提下提高工作效率.
王海燕崔文超许佩迪李闯
关键词:划分聚类聚类数阈值
基于组织型膜系统的划分算法研究与应用
膜计算为我们提供了一种新型的,可以进行海量数据处理的计算模型。膜计算具有分布式、极大并行性、海量储存性和非确定性等特点,将膜计算应用于中,会在保证质量的前提下大大提高效率。本身划分算法思想简单,时间复杂度...
王少霖
关键词:划分聚类算法初始聚类中心

相关作者

王赛芳
作品数:4被引量:33H指数:2
供职机构:西安理工大学理学院
研究主题:K-均值算法 划分聚类算法 划分聚类 初始聚类中心 聚类
刘佳佳
作品数:2被引量:0H指数:0
供职机构:扬州大学信息工程学院
研究主题:高维聚类 SDP 高维数据 划分聚类算法 聚类算法
王冲
作品数:7被引量:10H指数:1
供职机构:陕西师范大学
研究主题:聚类算法 萤火虫算法 蛋白质相互作用网络 聚类分析 免疫接种
彭丽
作品数:3被引量:8H指数:1
供职机构:大连理工大学
研究主题:MATLAB编程 划分聚类算法 聚类分析 主成分分析 数据挖掘技术
王林
作品数:170被引量:765H指数:12
供职机构:西安理工大学自动化与信息工程学院
研究主题:复杂网络 无线传感器网络 目标检测 网络 卷积神经网络