福建省科技厅青年人才基金(2008F306010107)
- 作品数:2 被引量:16H指数:2
- 相关作者:吕暾林锦贤陈颖林江宏更多>>
- 相关机构:福州大学更多>>
- 发文基金:福建省省属高校科研专项重点项目福建省科技厅青年人才基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 多核CPU和GPU加速分子动力学模拟被引量:6
- 2011年
- 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。
- 林江宏林锦贤吕暾
- 关键词:分子动力学图形处理器计算统一设备架构OPENMP
- LU分解和Laplace算法在GPU上的实现被引量:10
- 2011年
- 随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。
- 陈颖林锦贤吕暾
- 关键词:图形处理器LU分解统一计算设备架构共享存储器