您的位置: 专家智库 > >

郑彦奎

作品数:2 被引量:5H指数:2
供职机构:西北工业大学高性能计算研究与发展中心更多>>
发文基金:中国航空科学基金航天科技创新基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇BOLTZM...
  • 1篇多线程
  • 1篇多线程技术
  • 1篇信号量
  • 1篇图形处理器
  • 1篇外推
  • 1篇线程
  • 1篇线程技术
  • 1篇计算统一设备...
  • 1篇架构
  • 1篇方腔
  • 1篇CUDA
  • 1篇CUDA加速
  • 1篇LATTIC...
  • 1篇LATTIC...
  • 1篇处理器

机构

  • 2篇西北工业大学

作者

  • 2篇刘沙
  • 2篇郑彦奎
  • 1篇钟诚文
  • 1篇熊生伟
  • 1篇卓丛山
  • 1篇陈效鹏
  • 1篇周季夫
  • 1篇吴亮

传媒

  • 1篇计算机辅助设...
  • 1篇科学技术与工...

年份

  • 2篇2010
2 条 记 录,以下是 1-2
排序方式:
Lattice-Boltzmann方腔模型的CUDA加速实现被引量:3
2010年
对Lattice Boltzmann方法(LBM)在CUDA下的建模和算法进行了研究,使得该方法在GPU下的计算速度得到提升,大大缩短了计算过程的时间消耗。利用非平衡外推边界条件处理,以LBM方法模拟了D2Q9模型的方腔顶盖驱动流动,采用全局内存和纹理内存存储数据,将模型中9个分布函数存储为二维网格,每个网格分配一个线程,每个线程块包括256个线程,多条线程并行计算。在普通个人计算机上,采用NVIDIA GeForce 9600 GT显卡和CUDA,实现了LBM模拟方腔流动,将计算速度提高到CPU的50倍。
郑彦奎刘沙熊生伟周季夫
关键词:BOLTZMANN方法
多图形处理器上Lattice-Boltzmann方法的加速被引量:2
2010年
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144.
吴亮钟诚文郑彦奎刘沙卓丛山陈效鹏
关键词:CUDA多线程技术LATTICEBOLTZMANN方法信号量
共1页<1>
聚类工具0