朱连江
- 作品数:21 被引量:127H指数:2
- 供职机构:济南大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术经济管理社会学更多>>
- 分布/集中式高校管理信息系统及相关技术的研究
- 2003年
- 文中针对目前信息系统的应用 ,阐述了管理信息系统的弊端 ,提出了一种基于分布式的管理信息系统平台的建设方案 ,通过分布式系统的安全策略以及主动网络实现系统的安全访问 ,使系统间信息交流实时。
- 蔡建章戚新波朱连江曲守宁
- 关键词:网络安全主动网络
- 基于变异系数自动确认簇数量的聚类方法、系统及介质
- 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最...
- 刘腾腾曲守宁张坤杜韬王凯郭庆北朱连江王钦
- 文献传递
- 基于网址域名的文本分词方法、系统、设备及介质
- 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形...
- 杜韬李依谦曲守宁朱连江王信堂王希普
- 文献传递
- 基于Spark的流程对象并行数据挖掘的研究与实现被引量:1
- 2016年
- 本文研究了基于Spark的并行数据挖掘,并将其应用到了流程对象数据分析中。文章通过对串行的流程对象数据挖掘算法流的研究,提出了一种基于Spark并行计算框架的并行化算法流解决方案,并通过编程实现、并行效率测试、算法调优,最终得出一个并行效果良好的并行数据挖掘方案。该并行方案明显提高了计算效率。
- 郑雅飞杜韬朱连江曲守宁
- 关键词:数据挖掘并行计算SPARKMAPREDUCE
- 基于统计极值的流程对象时间序列时序计算算法
- 2016年
- 本文针对流程对象采样数据集,提出了一种基于统计极值的流程对象环节间时序计算算法,同时通过理论分析证明了该算法的正确性。该算法通过取数据的特征点,计算环节间特征点的时间距,并通过统计方法,计算出流程对象任意两环节间的延迟时间,进而得到多环节间的时序关系。通过实际流程工业采样数据集测试,可基本准确的求得任意环节数据之间的延迟时间距以及各环节间的时序关系。
- 朱桐霖杜涛曲守宁朱连江
- 关键词:数据挖掘时间序列极值
- 基于网址域名的文本分词方法、系统、设备及介质
- 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形...
- 杜韬李依谦曲守宁朱连江王信堂王希普
- 一种面向流程对象的工业过程建模预测方法
- 本发明公开了一种面向流程对象的工业过程建模预测方法,包括如下步骤:FNT模型建立,从流程对象已经生成的数据仓库中抽取工业流程对象原始数据集S,创建FNT模型的初始种群,种群个体数目根据需要定制,每个个体表示一个FNT模型...
- 王凯张坤杜韬郭庆北曲守宁张勇程新功朱连江王钦
- 文献传递
- 一种面向流程对象数据的规则提取方法
- 本发明涉及一种面向流程对象数据的规则提取方法,包括如下步骤:步骤S1:确定流程对象数据的最佳聚簇数量;步骤S2:采用K-means算法对流程对象数据进行聚类,同时验证步骤S1中的最佳聚簇数量的合理性,如果步骤S1中的最佳...
- 曲守宁杜韬王凯张坤郭庆北张勇程新功朱连江王钦
- 一种基于密度和扩展网格的数据流聚类方法
- 本发明涉及一种基于密度和扩展网格的数据流聚类方法,利用Spark并行计算平台,对传统的数据流聚类算法进行了分析和改进,提出了基于密度和扩展网格的数据流聚类算法,改进了人工设置聚类参数的缺陷,可以得到任何形状的聚类,算法基...
- 杜韬华峥牟国栋曲守宁张坤朱连江王钦
- 文献传递
- 一种基于密度峰值的数据流聚类方法及装置
- 本公开公开了一种基于密度峰值的数据流聚类方法及装置,以密度峰值和模糊聚类方法为基础,首次提出的疑似离群点的概念,以宽度自适应采样窗口模型以及空间‑时间衰减机制为主要创新点,以提高算法对数据流聚类的效率为主要目标和出发点,...
- 孙红卫张瑞杜韬王信堂许婧文朱连江
- 文献传递