徐传福
- 作品数:97 被引量:136H指数:6
- 供职机构:国防科技大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学航空宇航科学技术理学更多>>
- 高精度CFD程序的内外子区域划分异构并行算法被引量:1
- 2020年
- 对计算流体力学(Computational Fluid Dynamics,CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性。推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件。在“CPU(Intel Haswell Xeon E5-267012 cores×2)+加速器(Xeon Phi 7120A×2)”的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍。讨论和分析了性能瓶颈与存在的问题。
- 王巍徐传福车永刚
- 关键词:性能分析
- 并行模拟中支持踪迹文件并行输入输出的方法
- 本发明公布了一种并行模拟中支持踪迹文件并行输入输出的方法,目的是提出一种支持分布式并行Trace文件I/O的方法,提高并行模拟过程中Trace文件I/O的效率和模拟精度。技术方案是先构建运行并行模拟器的由主控节点和模拟节...
- 车永刚徐传福王勇献王正华彭宇行
- 基于八叉树细化四面体网格的飞行器仿真驱动设计方法
- 本申请涉及一种基于八叉树细化四面体网格的飞行器仿真驱动设计方法。所述方法包括:根据几何参数曲面以飞行器为中心建立远场的长方体包围盒,得到飞行器的三维几何模型;利用八叉树细化四面体网格对所述飞行器的三维几何模型进行网格化处...
- 高翔刘金宝龚春叶张翔徐传福刘杰
- 非结构网格CFD共享存储并行处理方法和系统
- 本申请涉及非结构网格CFD共享存储并行处理方法和系统,该方法包括调用网格剖分工具按照仅剖分物理分割区的剖分策略,对待求解的航行器非结构网格逐层进行递归剖分并对剖分后生成的各个子网格分区内的网格实体进行重排序;网格实体包括...
- 徐传福邱昊中陈世钊丁越车永刚郭晓威高翔李超张翔林拥真汪青松戴未希周正
- 基于递归分解的曲面网格生成方法及系统、计算机设备
- 本发明公开一种基于递归分解的曲面网格生成方法及系统、计算机设备,该方法采用直接法与映射法相结合的方式,利用映射的方式将直接法中在三维空间涉及到的相交判断转化在二维空间中进行操作,因此可以有效地简化所需要的大量的相交计算,...
- 高翔刘增晟张翔龚春叶徐传福刘杰
- 文献传递
- 分布数据更新的一致性处理方法
- 分布数据更新的一致性处理方法,针对多副本文件存储中数据更新一致性问题,增加了一个文件的“等待写”状态。更新首先按照副本号顺序进行,将各文件副本从“写打开”或“读/写打开”状态更改为“等待写”状态,当两次接收到“等待写”的...
- 彭宇行刘锋周航军张伟褚瑞李东升张一鸣陈振邦王意洁徐传福车永刚王勇献
- 文献传递
- 基于递归分解的曲面网格生成方法及系统、计算机设备
- 本发明公开一种基于递归分解的曲面网格生成方法及系统、计算机设备,该方法采用直接法与映射法相结合的方式,利用映射的方式将直接法中在三维空间涉及到的相交判断转化在二维空间中进行操作,因此可以有效地简化所需要的大量的相交计算,...
- 高翔刘增晟张翔龚春叶徐传福刘杰
- 基于SYCL的多相流LBM模拟跨平台异构并行计算研究被引量:1
- 2023年
- 异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理的格子数量以及形状,与基础并行版本相比,在CPU与GPU上分别取得了最高1.57以及1.34的加速比。结果表明,SYCL并行应用在CPU上更适合采用计算到工作项多对一映射的优化方法,在GPU上更适合采用ND-range并行内核,以提高性能。
- 丁越徐传福邱昊中戴未希汪青松林拥真王正华
- 关键词:格子玻尔兹曼方法
- 一种利用模拟器多种运行模式反复切换进行并行模拟的方法
- 本发明公开了一种利用模拟器多种运行模式反复切换进行并行模拟的方法,目的是减少模拟精度损失通并减少模拟时间。技术方案是构建运行模拟器的宿主机软硬件平台,服务器结点装有服务器端控制软件,模拟结点装有客户端控制软件;由服务器端...
- 徐传福车永刚王勇献褚瑞王正华彭宇行
- 一种Trace驱动的多核SMP集群并行性能模拟方法
- 2009年
- 基于新型多核SMP集群的层次化性能模型,本文在BigSim并行性能模拟器基础上实现了一个Trace驱动的多核SMP集群并行性能模拟器Sim-MSC。在一个InfiniBand多核SMP集群的宿主机平台上采用jacobi3D程序进行了测试,结果表明Sim-MSC能够模拟MPI消息传递并行应用程序在多核SMP集群上的执行特征,精确预测系统和应用性能。
- 翁玉芬徐传福车永刚方建滨王正华