徐磊
- 作品数:6 被引量:8H指数:2
- 供职机构:上海大学计算机工程与科学学院更多>>
- 发文基金:国家自然科学基金上海市教育委员会重点学科基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 高可扩展格子Boltzmann方法
- 2017年
- 格子Boltzmann方法(Lattice Boltzmann Method,LBM)是计算流体力学中的一种常用方法。由于LBM中的格点仅与相邻的格点间存在数据传递,因此具有良好的并行性。LBM并行算法中的数值通信部分通常采用的是格点上的微观量——分布函数。每次传递的分布函数具有多个不同的速度方向,为了进一步减少LBM并行算法的通信开销,从格子Boltzmann方法的物理特性以及相应的串行程序为切入点,深层次地挖掘可并行的因子,设计了专门用于通信面的类,使用数量较少的宏观量进行通信,降低了通信所占的比重,缩短了通信时间,提高了加速比和效率。实验表明,在4 096个计算核上依然有良好的加速比和效率。
- 徐磊刘智翔张承钿李开泰张淼程攀郭猛谢江张武
- 关键词:格子BOLTZMANN方法并行计算可扩展MPI
- 基于MRT-LBM方法的大规模可扩展并行计算研究被引量:3
- 2016年
- 在大规模三维复杂流动的数值模拟中,针对具有良好数值稳定性的多弛豫时间模型格子Boltzmann方法(MRT-LBM),并结合大涡模拟湍流模型和曲面边界插值格式,分析了在D3Q19离散速度模型下的网格生成、流场信息初始化和迭代计算3部分的可并行性.采用MPI编程模型,从分布式集群的特点和计算量负载均衡的角度出发,分别提出了适合于大规模分布式集群的网格生成、流场信息初始化和迭代计算的并行算法.该并行算法也能有效适用于D3Q15和D3Q27离散速度模型.通过在国产神威蓝光超级计算机上的测试,分别针对求解问题总体计算规模固定和保持每个计算核中计算量一致的2种情况的并行性能分析,验证了该并行算法在十万计算核的量级下仍具有良好的加速比和可扩展性.
- 刘智翔方勇宋安平徐磊王晓伟周丽萍张武
- 关键词:可扩展负载均衡BOLTZMANN大涡模拟
- 大规模带状线性方程组的分层混合并行求解算法被引量:1
- 2013年
- 并行计算过程中,全局通信往往会成为影响算法可扩展性的关键因素。因此,针对大规模带状线性方程组,提出基于MPI/OpenMP多粒度混合编程模型的分层并行算法,将全局通信转化为多次局部通信,解决了全局通信所带来的瓶颈问题,提高了大规模带状线性方程组并行求解算法的可扩展性。
- 徐磊郑汉垣刘智翔宋安平张武
- 关键词:MPI
- 大规模带状线性方程组混合编程并行求解
- 分布式共享存储集群系统已经成为高性能计算机的发展趋势,这种系统在每个节点内是共享内存的,而节点间则是分布式存储。为了充分利用这种多级体系结构,文中针对计算流体力学中的大规模带状线性方程组进行求解,建立了MPI/OpenM...
- 徐磊郑汉垣刘智翔封卫兵张武
- 关键词:混合编程模型MPIOPENMP
- 文献传递
- 多重网格格子Boltzmann方法的并行算法被引量:3
- 2014年
- 针对复杂流动数值模拟中的格子Boltzmann方法存在计算网格量大、收敛速度慢的缺点,提出了基于三维几何边界的多重笛卡儿网格并行生成算法,并基于该网格生成方法提出了多重网格并行格子Boltzmann方法(LBM)。该方法结合不同尺度网格间的耦合计算,有效减少了计算网格量,提高了收敛速度;而且测试结果也表明该并行算法具有良好的可扩展性。
- 刘智翔宋安平徐磊郑汉垣张武
- 关键词:格子BOLTZMANN方法多重网格可扩展性OPENMP
- 基于可视化库和信息传递接口云图显示的并行化处理被引量:1
- 2015年
- 基于可视化库(VTK)可视化技术的特点,讨论可视化流水线机制和并行程序的基本结构。针对计算流体力学可视化后处理实现的问题,介绍和使用VTK颜色映射算法,并编写对计算流体力学结果数据彩色云图显示的程序。然后为了解决时间开销大的问题,提出了并行显示算法。该算法充分利用VTK任务间的并行性,减少程序运行时间,提高运行效率。最后在多核环境下,对大小不同的文件彩色云图显示的加速比进行了对比分析。实验结果显示了随压力变化的彩色云图,表明基于VTK可视化技术能满足可视化后处理方面的要求,与信息传递接口(MPI)结合能取得很好的并行效果。
- 刘伟辉唐鹏宋安平刘智翔徐磊张武
- 关键词:可视化彩色云图加速比