杜玲玲
- 作品数:2 被引量:8H指数:2
- 供职机构:桂林电子科技大学电子工程与自动化学院更多>>
- 发文基金:广西可信软件重点实验室开放基金国家自然科学基金广西高校优秀人才计划项目更多>>
- 相关领域:理学自动化与计算机技术更多>>
- 并行MapReduce PLS算法及其在光谱分析中的应用被引量:5
- 2012年
- 偏最小二乘(PLS)算法是常用的光谱建模算法,然而对于海量光谱处理情形,在单台计算机上建模及优化时间开销很大。基于MapReduce编程模式,提出了并行MapReduce PLS回归算法,包括并行数据标准化和并行主成分提取两个过程。在多台普通计算机上搭建Hadoop云计算集群平台,以近红外光谱处理为例,开展了算法验证实验。实验结果表明,基于MapReduce编程模式的并行PLS算法对海量近红外光谱数据集进行回归建模时,能有效提高建模速度,随计算机台数的增多可得到接近线性的加速比,并具有良好的扩展性。
- 杨辉华杜玲玲李灵巧唐天彪郭拓梁琼麟王义明罗国安
- 关键词:近红外光谱MAPREDUCE并行计算HADOOP
- 基于Sector/Sphere的气相色谱质谱联用多样本并行对齐算法被引量:3
- 2013年
- 针对气相色谱质谱联用(GC-MS)数据处理过程复杂且计算量大、处理时间过长而严重拖延实验进度的问题,以多样本保留时间对齐为例,设计了基于分布式平台Sector/Sphere的GC-MS数据处理并行框架,实现了多样本并行对齐算法。首先分布式计算所有样本的相似度矩阵;然后依据层次聚类原理将原样本集划分为小样本集,分布式对齐各小样本集内部的样本;最后以各小样本集的平均样本作为对齐依据合并各样本集的对齐结果。实验结果表明:多样本并行对齐算法的错误率为2.9%,由4台PC组成的集群处理大量样本时,最高加速比达到3.29;能够在保证较高正确率的前提下提升计算速度,解决处理时间过长的问题。
- 杨辉华任洪军李灵巧段礼新郭拓杜玲玲漆小泉
- 关键词:SECTOR分布式计算