国家高技术研究发展计划(2004AA1Z2200)
- 作品数:3 被引量:8H指数:2
- 相关作者:冯晓兵陈莉张兆庆马琳王轶然更多>>
- 相关机构:中国科学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于动态profiling技术的流水粒度调优被引量:4
- 2005年
- 结点间流水是解决数据分布和计算分割不一致时的一种重要的并行发掘技术.结点间流水通过计算与通信的重叠获得并行度.精确的流水粒度是获得良好的流水性能的关键.流水分块取决于很多因素,如程序规模、程序的访问模式、结点规模、结点的计算能力和存储体系、通信系统的性能、通信库开销等等.提出了动态profiling方式并实现在流水粒度的推导中,运行时信息收集部分典型分块,结合代价模型推导流水粒度,该模型考虑局部性优化;探索如何减少插桩执行的开销的同时保证代价模型的精度.实验证明,这种方式有更好的适应性,能获得较好的流水并行.
- 马琳陈莉冯晓兵
- 非线性规律访存操作的数据预取技术被引量:2
- 2007年
- 编译器在静态分析方式下很难对程序的非线性规律访存操作进行正确的数据预取.但采用pro-filing技术可以得到程序运行时候的访存规律,利用这些信息可以精确地插入数据预取指令.基于strideprofiling技术,提出了新的信息收集类型strideiterative,更精确地反映程序执行时访存指令的实际行为,并结合别名分析的结果调整对同一cache行的数据预取,得到比普通数据预取更好的预取性能.安腾2上运行CPU2000的12个整型测试例子平均有8.54%的性能提升,其中mcf性能提升达到了77.87%.
- 吴佳骏冯晓兵张兆庆
- 关键词:数据预取编译器PROFILING性能分析非线性
- 全局部分重复计算划分被引量:2
- 2006年
- 并行化编译器常常采用拥有者计算规则来进行计算划分,为了提高性能和可扩展性,后来引入了部分重复计算划分的概念·这是一种针对并行程序节点间局部性的重要优化方法·以前的部分重复计算划分局限于一个循环套的范围,因此新提出了全局部分重复计算划分的问题,给出一个简化的性能模型和一个基于整数线性规划的全局部分重复计算划分框架·实验结果表明,其结果显著优于局限于单个循环套的部分重复计算划分,比以前提出的启发式方法有更好的适应性·
- 王轶然陈莉冯晓兵张兆庆
- 关键词:并行化编译器数据并行