公共文化服务平台

搜索到25651篇“ 划分聚类算法“的相关文章

基于划分聚类算法的船舶实时能效分析: 2024年; 为了实现多因素影响下的船舶营运能效综合优化与提升,需要开展船舶能效数据的挖掘与分析,探索切实有效的船舶能效优化方法。以内河航运船舶作为研究对象,分析了船舶能效的主要影响因素,开展了船舶能效数据采集与分析,基于划分聚类算法将船舶通航环境划分为不同等级,并在此基础上进行船舶实时能效数据分析,加快推广船舶实时能效在船舶运营中的应用,为提高内河船舶的能效水平提供理论方法与技术支持。; 易加宁徐士甲; 关键词：内河船舶划分聚类数据分析

划分聚类算法的改进研究: K-means算法和模糊C均值算法是经典的基于划分的聚类算法。该类算法简单易懂,易于实现,可以发现具有清晰边界的簇,在现实生活中得到了广泛的应用。然而,该类算法存在明显的局限性,包括初始簇中心的敏感性、聚类过程中容易陷入...; 郭凯

密度峰值算法和划分聚类算法的研究: 聚类算法在数据挖掘中一直有着很高的地位，与分类算法不同，聚类是一种无需事先知道数据具体特点的算法，也就是无监督算法。由于聚类算法能快速从繁杂的数据集中提取出有用的信息，使得该算法在一些领域发挥着巨大作用，如图像分割，语音...; 向驰; 关键词：数据挖掘划分聚类算法

基于层次聚类和划分聚类算法的BTS聚类算法研究被引量：1: 2022年; BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。; 刘康明艾鸽张宇傅毓; 关键词：层次聚类划分聚类

自适应密度划分聚类算法的优化研究: 密度峰值聚类算法是一种基于密度划分的聚类算法,与传统的聚类算法相比具有简单高效、对噪声不敏感、能准确找出聚类中心以及快速分配样本点等优势,近些年广受研究人员的关注。但其本身也存在一定的缺陷,本文针对密度峰值聚类算法在计算...; 纪耀立; 关键词：相对密度最小生成树

基于Spark框架和ASPSO的并行划分聚类算法被引量：8: 2022年; 针对划分聚类算法处理海量的数据存在的数据离散系数较大与抗干扰性差、局部簇簇数难以确定、局部簇质心随机性及局部簇并行化合并效率低等问题,提出了一种基于Spark框架和粒子群优化自适应策略(ASPSO)的并行划分聚类(PDC-SFASPSO)算法。首先,提出了基于皮尔逊相关系数和方差的网格划分策略获取数据离散系数较小的网格单元并进行离群点过滤,解决了数据离散系数较大与抗干扰性差的问题;其次,提出了基于势函数与高斯函数的网格划分策略,获取局部聚类的簇数,解决了局部簇簇数难以确定的问题;再次,提出了ASPSO获取局部簇质心,解决了局部簇质心的随机性问题;最后,提出了基于簇半径与邻居节点的合并策略对相似度大的簇进行并行化合并,提高了局部簇并行化合并的效率。实验结果表明,PDC-SFASPSO算法在大数据环境下进行数据的划分聚类具有较好的性能表现,适用于对大规模的数据集进行并行化聚类。; 毛伊敏甘德瑾廖列法陈志刚; 关键词：网格划分

基于MapReduce和改进密度峰值的划分聚类算法被引量：7: 2021年; 对于基于划分的聚类算法随机选取初始聚类中心导致初始中心敏感,聚类结果不稳定、集群效率低等问题,提出一种基于MapReduce框架和改进的密度峰值的划分聚类算法(based on MapReduce framework and improved density peak partition clustering algorithm,MR-IDPACA)。首先,通过自然最近邻定义新的局部密度计算方式,将搜索样本密度峰值点作为划分聚类算法的初始聚类中心;其次针对算法在大规模数据下运行时间复杂,提出基于E2LSH(exact Euclidean locality sensitive hashing)的一种分区方法,即KLSH(K of locality sensitive hashing)。通过该方法对数据分区后结合MapReduce框架并行搜寻初始聚类中心,有效减少了算法在搜索初始聚类中心时的运行时间;对于MapReduce框架中的数据倾斜问题,提出ME(multistage equilibrium)策略对中间数据进行多段均衡分区,以提升算法运行效率;在MapReduce框架下并行聚类,得到最终聚类结果。实验得出MR-IDPACA算法在单机环境下有着较高的准确率和较强的稳定性,集群性能上也有着较好的加速比和运行时间,聚类效果有所提升。; 黄学雨向驰陶涛; 关键词：划分聚类算法 MAPREDUCE

基于MapReduce和改进人工蜂群算法的并行划分聚类算法被引量：6: 2021年; 针对大数据背景下基于划分的聚类算法中存在参数寻优能力不佳、初始中心敏感、数据倾斜等问题,提出一种基于MapReduce和人工蜂群(artificial bee colony,ABC)算法的并行划分聚类(the partitioning-based clustering algorithm by using improve artificial bee colony based on MapReduce,MR-PBIABC)算法。首先,提出基于反向学习和聚类准则函数的初始化策略(backward learning and the clustering criterion function,BLCCF),提升人工蜂群算法搜索的解质量,并将ABC算法和人工鱼群(artificial fish colony,AFS)算法结合,提出改进人工蜂群(improve artificial bee colony,IABC)算法,通过利用AFS算法最优解能力较强的特性,来提高ABC算法的寻优能力;其次,根据改进的人工蜂群算法IABC获取初始聚类中心,提出相对熵策略(relative entropy strategy,RES)衡量人工鱼间的距离,保证获得的初始聚类中心是最优人工鱼状态,从而有效避免了随机选取初始聚类中心,引起的初始中心敏感的问题;再次,设计数据均衡策略(data balancing strategy,DBS),通过动态收集节点负载并分配节点间的负载,解决了节点上数据倾斜的问题;最后,结合MapReduce计算模型,并行挖掘簇中心,生成最终聚类结果。实验结果表明,MR-PBIABC算法的聚类效果更佳,同时在大数据环境下,能有效地提高并行计算的效率。; 陶涛毛伊敏; 关键词：MAPREDUCE

Canopy在划分聚类算法中对K选取的优化被引量：13: 2020年; 针对划分聚类算法中聚类数K的取值工作量较大的问题,提出一种新的Canopy+算法.该算法可实现对聚类个数K的预判,在保证准确率的前提下提高聚类工作效率.; 王海燕崔文超许佩迪李闯; 关键词：划分聚类聚类数阈值

基于组织型膜系统的划分聚类算法研究与应用: 膜计算为我们提供了一种新型的，可以进行海量数据处理的计算模型。膜计算具有分布式、极大并行性、海量储存性和非确定性等特点，将膜计算应用于聚类中，会在保证聚类质量的前提下大大提高聚类效率。本身划分聚类算法思想简单，时间复杂度...; 王少霖; 关键词：划分聚类算法初始聚类中心

加载更多 ∨

相关作者

用户反馈

相关作者

用户登录

用户反馈