郑彦奎
- 作品数:2 被引量:5H指数:2
- 供职机构:西北工业大学高性能计算研究与发展中心更多>>
- 发文基金:中国航空科学基金航天科技创新基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Lattice-Boltzmann方腔模型的CUDA加速实现被引量:3
- 2010年
- 对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存存储数据,将模型中9个分布函数存储为二维网格,每个网格分配一个线程,每个线程块包括256个线程,多条线程并行计算。在普通个人计算机上,采用NVIDIA GeForce 9600 GT显卡和CUDA,实现了LBM模拟方腔流动,将计算速度提高到CPU的50倍。
- 郑彦奎刘沙熊生伟周季夫
- 关键词:BOLTZMANN方法
- 多图形处理器上Lattice-Boltzmann方法的加速被引量:2
- 2010年
- 为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144.
- 吴亮钟诚文郑彦奎刘沙卓丛山陈效鹏
- 关键词:CUDA多线程技术LATTICEBOLTZMANN方法信号量