赵京霞 作品数:10 被引量:57 H指数:5 供职机构: 新疆大学软件学院 更多>> 发文基金: 国家自然科学基金 博士科研启动基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于k-d树分区的聚类算法并行加速策略 被引量:3 2019年 针对传统K-Means算法存在准确率低、聚类速度慢的问题,从K-Means算法优化和Flink框架并行层面对K-Means算法优化。为避免算法陷入局部最优解,采用质心间最大距离原则选出k个质心;为提高大数据量下的K-Means聚类速度,提出用k-d树算法划分数据集实现操作算子并行化,设置多个TaskManager数目和CPU核数加速F-KMeans算法的执行。实验结果表明,较K-Means算法,F-KMeans算法的准确率提高了约3.6%;F-KMeans算法在DataSource耗时降低了45.45%,在其余阶段耗时平均降低了约28.57%。 汪丽娟 钱育蓉 侯海耀 张晗 赵京霞 赵燚关键词:数据分区 并行化 基于写页面热度的混合内存页面管理策略 被引量:2 2021年 针对阻变存储器(RRAM)写延迟大的问题,提出一种基于写页面热度的混合内存页面管理策略,将写页面进行冷热区分,存于动态随机访问存储器(DRAM)上,减少RRAM上的写数量.在基准程序集PARSEC下对混合内存系统的性能进行测试与分析.结果表明,所提出的页面管理策略可以有效地提高系统性能. 杜娇 钱育蓉 张猛 赵京霞 张文冲基于深度学习的单图像超分辨率重建研究综述 被引量:23 2020年 为深入了解基于深度学习的单图像超分辨率重建(SISR)的发展,把握当前研究的热点和方向,针对现有基于深度学习的单图像超分辨率重建模型进行了梳理。介绍了相关深度学习算法和基于深度学习的模型以及评价指标,并通过实验对比分析现有模型的性能,其目的在于从本质上了解基于深度学习的单图像超分辨率重建模型的优势;对单图像超分辨率重建的关键问题进行了总结,并对未来的发展趋势进行了展望。 南方哲 钱育蓉 行艳妮 赵京霞一种Spark下分布式DBN并行加速策略 被引量:1 2018年 Spark下分布式深度信念网络(Distributed Deep Belief Network,DDBN)存在数据倾斜、缺乏细粒度数据置换、无法自动缓存重用度高的数据等问题,导致了DDBN计算复杂高、运行时效性低的缺陷.为了提高DDBN的时效性,提出一种Spark下DDBN数据并行加速策略,其中包含基于标签集的范围分区(Label Set based on Range Partition,LSRP)算法和基于权重的缓存替换(Cache Replacement based on Weight,CRW)算法.通过LSRP算法解决数据倾斜问题,采用CRW算法解决RDD(Resilient Distributed Datasets)重复利用以及缓存数据过多造成内存空间不足问题.结果表明:与传统DBN相比,DDBN训练速度提高约2.3倍,通过LSRP和CRW大幅提高了DDBN分布式并行度. 黄震 钱育蓉 于炯 英昌甜 赵京霞关键词:缓存替换 基于Android的二手书交易平台 被引量:5 2015年 随着市场经济的发展和人们生活水平的提高,二手书的市场是一个环保和低成本看书的选择,在学校里,二手书商店就带给同学们一个供需平台,但是,对于二手书籍的管理和销售,普通的旧书市场不能有效的进行,而随着安卓手机的广泛使用,用手机购买商品或获取信息已成为现代人的一种生活习惯。而使用手机上网更是大学生活不可或缺的一部分,所以一个独立的能够满足用户需求的校园二手图书交易平台的设计与开发是十分有必要也是可行的。 祝桥 孙莉 赵京霞关键词:ANDROID CNN多层特征融合与ELM的乳腺疾病诊断方法 被引量:6 2020年 针对传统计算机辅助诊断方法准确率低、耗时长的问题,提出卷积神经网络(Convolutional Neural Networks,CNN)多层特征融合与极限学习机(Extreme Learning Machine,ELM)的乳腺疾病诊断方法。利用CNN从乳腺X光图像中提取多层特征;提出多尺度池化操作将各层提取的特征进行融合;使用极限学习机分类器进行乳腺疾病的快速诊断。实验结果表明,该乳腺疾病检测方法平均准确率高达97.13%,诊断时间是6.43 ms。该方法能有效地提高乳腺疾病诊断的准确率,缩短诊断时间,且具有较好的鲁棒性和泛化能力。 赵京霞 钱育蓉 南方哲 张晗 行艳妮关键词:多特征融合 极限学习机 乳腺疾病诊断 Spark环境下K-means初始中心点优化研究综述 被引量:9 2020年 为了能够及时了解Spark环境下经典聚类算法K-means的最新研究进展,把握K-means算法当前的研究热点和方向,针对K-means算法的初始中心点优化研究进行综述。首先介绍了内存计算框架Spark和K-means算法,并分析了K-means算法聚类不稳定性的成因和影响,其目的在于指出优化K-means算法的重要性;详细介绍了目前在Spark环境下优化K-means初始中心点的主要方法和最新研究现状,并展望了K-means初始中心点优化问题的未来研究方向。 行艳妮 钱育蓉 南方哲 赵京霞关键词:K-均值算法 聚类算法 基于改进的卷积神经网络LeNet-5乳腺疾病诊断方法 被引量:3 2019年 针对计算机辅助乳腺疾病诊断方法准确率低、耗时长等问题,提出一种基于改进的卷积神经网络(CNN)的乳腺疾病诊断方法.该方法从以下3个方面做了改进:(1)设计双通道卷积神经网络来解决单通道特征提取不充分的问题;(2)采用Dropout技术有效地防止过拟合现象;(3)采用支持向量机(SVM)代替传统的Softmax分类器以减少运算量,提高运算速度.测试结果表明:所提出的分类模型平均准确率高达92.31%,平均训练时间为968s,充分验证了该方法的有效性. 赵京霞 钱育蓉 张猛 杜娇关键词:计算机辅助诊断 卷积神经网络 双通道 医学图像分类 基于卷积神经网络的乳腺疾病检测算法 2019年 为提高计算机辅助乳腺疾病检测的准确率,提出一种基于卷积神经网络的乳腺疾病检测算法.首先,分别从卷积神经网络中提取图像的浅层特征与深层特征并对其进行加权融合;其次,通过在卷积神经网络中构建空间金字塔池化层,实现了卷积神经网络的多尺度输入;最后,在Mammographic Image Analysis Society(MIAS)数据集上进行验证实验.实验结果表明,本文提出的乳腺疾病检测算法平均准确率高达94.93%,与其他乳腺疾病检测算法进行对比实验可知,本文提出的乳腺疾病检测算法具有更高的检测准确率. 赵京霞 钱育蓉 张猛 杜娇关键词:卷积神经网络 改进的CK-means优化及并行策略 被引量:7 2020年 针对大数据背景下K-means存在选取质心导致的局部最优解、聚类速度慢的问题,提出一种Flink平台下的CK-means聚类优化及并行策略。从算法优化层面,采用Canopy算法确定聚类数目k并选取初始质心;从并行化加速层面,基于Flink平台设计了一种面向CK-means的并行加速策略,并分析不同并行度对计算耗时的影响。经实验,相较于K-means算法,CK-means算法的准确率与迭代次数间的比值更高,算法性能更优,在iris数据集中性能比提升44.79%,在wine数据集中性能比提升32.03%;同时证明了不同并行度下CK-means算法的聚类耗时呈现先下降后上升的趋势,其聚类耗时的最小值与数据集的大小相关。 赵鑫 汪丽娟 行艳妮 赵燚 赵京霞 钱育蓉关键词:大数据 并行化 聚类算法