国家自然科学基金(60673150)
- 作品数:3 被引量:5H指数:2
- 相关作者:刘杰迟利华周涤宇更多>>
- 相关机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于安腾微处理器的程序性能优化与分析被引量:3
- 2011年
- 高性能计算越来越广泛地应用到科学和工程的各个领域,但实际应用程序获得的性能并未随着机器峰值性能的提高而同比例提高,应用程序只能发挥峰值性能的5%~10%左右,而且两者的差距在扩大,程序性能优化作为解决该问题的方法之一得到了学术界的广泛关注。本文基于安腾微处理器,总结了程序优化的通用方法,给出了程序优化与分析的一般步骤。根据优化与分析步骤,首先对四个程序进行了详细的性能分析,找到性能瓶颈和重点子程序;然后分别根据四个程序的特点,采用基于Cache和指令流水线的优化技术,对程序进行了性能优化;最后给出了性能优化测试结果,分别得到8%~33%的性能提高,取得了良好的优化效果。
- 迟利华刘杰
- 关键词:程序性能优化
- 一种改进的求解输运方程的并行Sn扫描算法被引量:2
- 2008年
- 非结构网格上求解粒子输运方程的可扩展并行算法是一个亟待解决的课题。本文在文献[1]并行流水线Sn扫描算法的基础上提出了一种改进算法。改进后的算法可以有效降低原算法对并行机通信延迟的依赖,减少程序运行的通信时间,达到了缩短并行计算时间和提高并行性能的目的。针对二维粒子输运问题进行的数值实验表明,从64扩展到256个处理机时,加速比呈线性增长,改进算法比原算法的并行计算时间最大减少了19%。
- 周涤宇刘杰
- 关键词:输运方程非结构网格
- 结合能群和区域分解的粒子输运并行计算
- 由于所模拟物理问题的复杂性,非定常粒子输运方程是一个涉及大量物理量的复杂微分积分方程,只能采用数值模拟方法求解,以确定粒子在几何空间、能量、相空间及时间等高维空间上的分布。基于非结构网格的间断有限元全隐离散格式的离散纵标...
- 刘杰陈静迟利华胡庆丰
- 关键词:粒子输运非结构网格负载平衡并行计算
- 文献传递
- 非线性扩散方程的显式并行计算
- 2010年
- 在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在4核Xeon处理器构成的分布共享集群系统上可扩展到1024个CPU核,相对于64个CPU核,其加速比为7.06。
- 迟利华刘杰
- 关键词:非线性扩散方程并行计算