复旦大学软件学院并行处理研究所
- 作品数:102 被引量:438H指数:10
- 相关作者:朱传琪黄波朱嘉华马国凯高晓桐更多>>
- 相关机构:江南大学数字媒体学院中国科学院计算技术研究所华东理工大学信息科学与工程学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电子电信理学文化科学更多>>
- 程序周期行为技术分析
- 2015年
- 由于程序中存在大量循环和递归,程序执行过程中通常体现大量周期行为。这些周期行为的不同实例行为相似,具有类似体系结构特性,如类似的缓存访问特性和C PI等。这种程序行为执行的相似性也为各种体系结构和编译优化提供了可能。探讨了周期行为分析的关键因素、当前主流技术以及主要应用领域。在对现有周期行为分析技术的不足进行讨论的基础上,展望了程序周期行为分析技术的发展趋势。
- 隋然张铮张为华
- 关键词:动态优化
- 一种高效的基于局部特征的显著区域检测算法被引量:3
- 2012年
- 图像特征提取是图像/视频检索问题的关键。研究人员发现,假如对整张图像或视频帧做特征提取,会产生大量的特征信息,从而影响图像/视频帧的匹配时间。由于人们通常只对图像中部分关键的区域感兴趣,因此在对图像做局部特征提取时可以先对图像进行显著区域检测,排除非关键区域上的特征信息,从而减低匹配所需的特征点数,提高匹配的处理速度。但是由于传统的显著区域检测算法计算复杂,会对图像特征提取过程产生额外的时间开销。提出一种快速的显著区域检测算法,根据局部特征提取算法特征检测阶段得到的特征点分布,利用最大子矩阵和算法,在损失较小的准确度的情况下快速检测出图像的显著区。
- 朱斐文肖菁戴晨张为华
- 用于含过程调用DO循环的循环嵌入方法
- 1997年
- 循环是程序中蕴含并行性最为丰富的一种结构,因此成为并行化编译最主要的对象.但循环内的过程调用严重妨碍了循环的数据相关性分析,使得循环语句潜在的大量并行性得不到开发.本文提出的循环嵌入方法使部分含过程调用循环语句的并行化成为可能,对部分用其它过程间分析技术也能开发其并行性的这一类循环语句采用循环嵌入方法,并行化开销低,并且分析更精确.采用循环嵌入方法还可降低程序由于多次过程调用带来的调度开销.这一方法在作者开发的自动并行化编译系统AFT(automaticPortrantransformer)中得到了实现,对Spec92测试程序包的试验结果表明了本文提出的方法是行之有效的.
- 原庆能丁永华臧斌宇朱传琪
- 关键词:并行编译系统
- 一种动态分布数组的数据划分模式被引量:2
- 2005年
- 数据划分是分布主存系统中并行编译的关键技术,它以数组和包含这些数组的嵌套循环为研究对象,以提高数据局部性和挖掘计算并行性为根本目的。对满足给定模式的动态分布的数组向量,通过选取代表元,给出数据划分模式。将单个嵌套循环内的数据划分技术和过程间投影技术很好地结合,解决了动态分布数组的数据划分问题。这种模式弥补了现有数据划分研究的不足。
- 丁强臧斌宇朱传琪
- 关键词:数据划分
- 多处理机系统循环间数据重用的cache优化被引量:5
- 1998年
- cache的使用缓解了CPU和主存储器之间速度差距太大的矛盾,同时,也使cache的命中率成为影响多处理机系统性能发挥的重要因素.人们对如何加强数据的局部性,提高cache命中率,使多处理机系统的性能得到更好的发挥进行了积极的探索.但过去的工作主要集中于如何加强并行循环内的数据局部性,减少甚至消除并行循环内真假共享cache行所引起的cache抖动,对多处理机系统中循环间数据重用的开发和利用却少有论述.该文对如何开发和利用这些循环间数据重用进行了分析和讨论,并提出了一些切实可行、易于实现的方法.这些方法的应用能够有效地提高cache的命中率。
- 丁永华原庆能臧斌宇朱传琪
- 关键词:多处理机系统数据重用最佳化
- 多核缓存优化技术研究综述被引量:1
- 2015年
- 随着多核技术的迅速发展,并发处理和大批量数据操作成为主流,而为了应对更加复杂的程序行为和愈发庞大的数据量,缓存系统的效率也正面临着严重的挑战.如何在复杂的多核环境中更高效的使用缓存,提高缓存响应速度和数据吞吐量一直是体系结构领域的重要课题和研究热点.针对多核环境中缓存的应用场景进行分析,从缓存的效率,内容和共享使用三个角度进行归纳和总结,提出缓存应用的时延问题,容量问题,共享问题等具有针对性的问题,并且对针对这些具体问题和情境的缓存优化技术进行总结和综述,同时对缓存优化的一些新技术和新的优化角度进行探讨,最后对多核缓存优化技术的发展前景进行展望.
- 闵庆豪张为华
- 关键词:缓存多核架构
- 基于指针数组的数据划分模式被引量:2
- 2005年
- 数据划分是分布主存系统中并行编译的关键技术,它以数组和包含这些数组的嵌套循环为研究对象,以提高数据局部性和挖掘计算并行性为根本目的。传统数据划分模式不适合指向数组的指针数组的数据划分,论文提出了解决该类指针数组数据划分的划分模式,文中称为数组向量的数据划分。分析其数据引用的特性,通过选取代表元,给出数据划分的策略,弥补了现有数据划分研究的不足。
- 丁强臧斌宇朱传琪
- 关键词:数据划分指针数组
- 用计算函数模型增强数据流分析被引量:1
- 2000年
- 精确的数据流分析 ,需要充分利用条件分支语句的逻辑语义 .为了简洁而有效地处理条件分支语句 ,该文提出了对应于程序段的计算函数模型 ,在该模型里表示条件分支语句的逻辑语义 ,并利用文中提出的不确定性消解方法 ,可以把通常需要逻辑推理来处理的数据流分析问题转化为空间区域之间覆盖关系的判定问题 .而这个问题在并行化编译的理论和实践中已有比较成熟的解决办法 .
- 胡世亮臧斌宇朱传琪
- 关键词:数据流分析并行化编译器
- 测试任一嵌套DO循环置换合法性的阻碍矩阵算法
- 1996年
- 对程序进行并行变换是提高程序并行性的有效手段。许多并行变换都要寻找一种最优的循环置换。在寻找过程中,如果对每一个被考察的置换都重新进行相关性测试,那么整个寻找过程将极费时间。本文给出了一个测试嵌套循环任一置换的阻碍矩阵测试算法。它将测试任一循环置换的合法性转化为测试一组向前置换的合法性,并且仅需对嵌套循环做一遍相关性测试。利用该算法可以简便迅速地检查任一循环置换的合法性。从而使许多并行变换变得实际可行。
- 林源朱传琪
- 程序自动并行化系统中IR的面向对象设计被引量:3
- 1999年
- 从构造一个高性能的程序自动并行化系统的需求出发,介绍了程序自动并行化系统AGASSIZ中IR(IntermediateRepresentation)的设计原则与设计方法,阐明了此种IR的设计给整个程序自动并行化系统的设计所带来的便利。
- 张瑜黄波朱传琪
- 关键词:程序自动并行化IR面向对象