朱颢东
- 作品数:128 被引量:484H指数:10
- 供职机构:郑州轻工业学院更多>>
- 发文基金:四川省科技计划项目四川省科技攻关计划博士科研启动基金更多>>
- 相关领域:自动化与计算机技术文化科学机械工程环境科学与工程更多>>
- 基于K-Means和Apriori算法的多层特征提取方法被引量:3
- 2015年
- 根据科技文献的结构特点,论文提出了一种四层挖掘模式,并结合K-means算法和Apriori算法,构建一个新的特征词提取方法——MultiLM-FE方法.该方法首先依据科技文献的结构将其分为4个层次,然后通过K-means聚类对前3层逐层实现特征词提取,最后再使用Aprori算法找出第4层的最大频繁项集,并作为第4层的特征词集合.该方法能够解决K-means算法不能自动确定最佳聚类初始点的问题,减少了聚类过程中信息损耗,这使得该方法能够在文献语料库中更加准确地找到特征词,较之以前的方法有很大提升,尤其是在科技文献方面更为适用.实验结果表明,该方法是可行有效的.
- 钱慎一朱艳玲朱颢东
- 关键词:特征提取K-MEANS算法APRIORI算法
- 结合优化的文档频和LSA的特征选择方法被引量:2
- 2009年
- 为了提高文本分类算法的效率和精度,必须使用特征选择算法来降低特征空间的维数。然而许多常用特征选择算法在选择属性时,只是利用特征的权重而并没有考虑特征之间的隐含关系,使得得到的特征集存在一定的冗余,并不具备较好的代表性。首先给出了一个基于最小词频的文档频方法,并用它过滤掉一些词条以降低文本矩阵的稀疏性,然后使用LSA进行词语间的语义分析,消除同义词和多义词的影响,提高了文本分类的速度与精确度。实验结果表明此种特征选择方法效果良好。
- 朱颢东钟勇
- 关键词:文本分类词频潜在语义分析
- 基于优化的文档频和粗糙集的特征选择方法被引量:5
- 2009年
- 特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用基于最小词频的文档频方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.
- 朱颢东钟勇
- 关键词:文本分类词频属性约简粗糙集
- 基于改进Apriori算法的铁路轨道质量分析与评价被引量:5
- 2015年
- 设计了一种基于改进Apriori算法的铁路轨道质量分析与评价系统.首先对原始病害数据进行预处理,消除冗余数据,建立有效数据仓库;然后将数据进行分块处理,并对对应的决策表约简;最后利用改进Apriori算法减少扫描候选频繁项集的次数,寻找相应关联规则.通过对工务段线路病害进行评价,验证了该系统设计方案的合理性和有效性.
- 朱付保白庆春汤萌萌朱颢东
- 关键词:关联规则铁路病害数据挖掘
- 基于优化文档频和信息量的特征选择方法被引量:2
- 2009年
- 针对文本分类中几种典型的特征选择方法存在的不足,提出基于优化文档频和信息量的特征选择方法。该方法首先使用优化的文档频方法进行特征选择以降低文本向量的稀疏性,然后利用所提属性的约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明:该方法同3种经典特征选择方法相比,"互信息"和"统计量"以及"信息增益"都要好。
- 张韬朱颢东
- 关键词:词频粗糙集属性约简
- 一种无决策属性的信息系统的属性约简算法被引量:3
- 2010年
- 经典属性约简及其延伸算法是基于有决策属性的信息系统的属性约简算法,它们对无决策属性的信息系统的属性约简无能为力.为此,本文以粗集理论为基础,对无决策属性的信息系统从集合论的论域划分方面进行研究,提出了一种适用于无决策属性的信息系统的启发式属性约简算法.该算法在一定程度上能够解决无决策属性的信息系统属性约简问题,进一步扩展了粗集理论的应用范围.实例表明该算法是有效可行的.
- 朱颢东钟勇
- 关键词:属性约简信息系统集合论
- 基于实时性的Java虚拟机垃圾收集算法被引量:1
- 2010年
- 提出了一种适用于实时性环境的Java虚拟机垃圾收集算法。该算法对增量式收集器中堆空间的划分方式、引用跟踪等方面进行了改进,以减少垃圾收集带来的不确定性暂停,并可以使用户指定一个时间段内垃圾收集导致应用程序暂停的最长时间,从而使其适用于实时性环境。实验结果表明,该算法有效减少了暂停的频率和时长。
- 白江涛钟勇朱颢东
- 关键词:垃圾收集实时性
- 多源数据融合技术在后备干部管理系统中的应用被引量:3
- 2014年
- 随着社会信息化进程的逐步深入,各部门中已有业务系统在数据集成和信息共享方面存在不足,已达不到时信息资源整体开发利用的要求,这给后备干部信息管理工作带来了诸多不便。针对后备干部管理的业务特点和信息化的发展趋势,研发一个以数据集成和信息共享为目标的后备干部管理系统显得尤为重要。通过全面分析后备干部管理的业务需求和数据特点,提出了基于.NET平台和SQLite数据库的后备干部管理系统的设计方案,并以河南省为应用实例,验证了该系统设计方案的合理性和有效性。
- 朱付保徐显景霍晓齐朱颢东
- 关键词:数据集成数据融合信息孤岛信息共享数据仓库
- 基于Multi-agent的网络资源动态调度方法被引量:1
- 2013年
- 在对目前流行的调度方法分析、总结的基础上,根据Agent具有自治性、反应性、社会能力性以及能动性的特点,提出一种基于Multi-Agent的网络资源动态调度方法。该方法根据系统当前的负载分布状况,对具有负载的节点通过通信工具,经过迁移手段,使资源分配到轻负载的节点,以实现节点的负载均衡,从而最终实现真个网络系统的负载均衡。仿真实验表明该方法可以更好地帮助人们在网络中进行资源的管理和调度,有效地提高网络服务器的性能,缩短系统延迟时间,增大系统吞吐量,以解决大用户量并发访问和大容量数据存储的问题。
- 朱颢东王秉政
- 关键词:负载均衡分布式调度动态调度
- 一种改进的K-means动态聚类算法被引量:14
- 2016年
- 传统的K-means算法通过不断的重复计算来完成聚类,聚类中心点的不断变化产生的一些动态变化信息将对聚类产生一定的干扰,且当数据量过大时,算法的时间开销和系统的I/O开销将大大增加,这严重影响了算法的性能。为此,论文提出一种改进的K-means动态聚类算法,该算法充分考虑了K-means聚类过程中信息的动态变化,通过为算法的终止条件设定标准值,来减少算法迭代次数,减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰,使算法达到更准确更高效的聚类效果。实验结果表明,当数据量较大时,相比于传统的K-means算法,改进后的K-means算法在准确率和执行效率上都有较大的提升。
- 张阳何丽朱颢东
- 关键词:K-MEANS聚类分析数据挖掘动态聚类