黄娟娟
- 作品数:4 被引量:7H指数:1
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- GCC中自动向量化代价模型剖析
- MD数据并行结构在高性能通用微处理器中普遍存在,编译器的自动向量化是充分开发SIMD并行的主要手段之一.GCC编译器作为广泛使用的开源编译器,在O3优化级别,已经开启了面向SIMD结构的自动向量化开关.自动向量化代价模型...
- 黄娟娟李春江徐颖
- 关键词:单指令多数据自动向量化
- 基于数据对齐属性指导的GCC自动向量化优化
- 2014年
- 主流通用处理器都已经实现了多核并行以及处理器核内的SIMD并行。虽然GCC编译器实现了面向SIMD并行的自动向量化,但是编译器针对OpenMP并行程序的自动向量化效果仍很不理想。针对多线程并行的OpenMP程序,基于GCC的OpenMP编译实现,扩展了数据对齐属性指导语句,使编译器在自动向量化时能够进行更准确的数据对齐与否的判断,优化了GCC编译器的自动向量化。
- 李春江黄娟娟徐颖董钰山
- 关键词:自动向量化GCC
- 典型编译器自动向量化效果评估与分析被引量:6
- 2013年
- SIMD(Single-Instruction-Multiple-Data)体系结构在现代处理器体系结构中扮演重要的角色。多种国产高性能通用处理器也大都实现了SIMD结构。SIMD体系结构提供了短向量数据并行处理能力,编译器自动向量化是应用程序获得性能提升的主要手段之一。使用成熟的支持SIMD的商用处理器平台评估典型编译器自动向量化的效果,对于处理器体系结构的设计以及编译器的分析和设计非常有益。采用SPECCPU2006和SPECOMPM2001基准测试程序,评估了典型编译器(包括Intel编译器、PGI编译器和GCC编译器)的自动向量化的效果。并且以产品级的开源编译器GCC为目标,用手工编写的程序片段(主要是多种类型的循环结构)评估了当前GCC编译器自动向量化的效果,并深入分析了GCC编译器中现有的自动向量化的能力和局限。此项工作为进一步研发高效的编译器自动向量化提供了有价值的参考。
- 李春江黄娟娟徐颖杜云飞陈娟
- 关键词:自动向量化GCC
- SIMD指令集设计空间的形式化描述被引量:1
- 2013年
- SIMD(Single-Instruction-Multiple-Data)并行体系结构在现代处理器体系结构中扮演非常重要的角色。SIMD指令集已经成为处理器指令集中重要的子集。SIMD结构和指令集实现了短向量并行处理能力,SIMD指令集实现了对多种数据类型、多种操作模式的支持。采用形式化的方法,描述SIMD指令集的设计空间,从多个正交的维度刻画SIMD指令集的设计,基于此详细讨论了SIMD指令集的设计问题。该形式化方法有益于对SIMD指令集体系结构的分析和设计。
- 李春江徐颖黄娟娟杨灿群
- 关键词:SIMD指令集形式化描述