余磊 作品数:9 被引量:20 H指数:3 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 北京市自然科学基金 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
处理器内指令级流水线控制方法及其系统 本发明涉及处理器内指令级流水线控制方法和系统,方法包括:步骤1,初始化发射序号寄存器和写回序号寄存器初始值相同;步骤2,发射指令时,以发射序号寄存器的值为基础值,按指令在本次发射中的顺序,生成指令的发射序号,并在指令中携... 余磊 张浩 刘志勇 范东睿处理器内指令级流水线控制方法及其系统 本发明涉及处理器内指令级流水线控制方法和系统,方法包括:步骤1,初始化发射序号寄存器和写回序号寄存器初始值相同;步骤2,发射指令时,以发射序号寄存器的值为基础值,按指令在本次发射中的顺序,生成指令的发射序号,并在指令中携... 余磊 张浩 刘志勇 范东睿文献传递 众核处理器片上同步机制和评估方法研究 被引量:11 2010年 同步机制是片上多核/众核处理器正确执行和协同通信的关键,其效率对处理器的性能非常重要.针对片上众核体系结构,提出并实现了两种粗粒度同步机制和一种细粒度同步机制,即片上专用硬件支持的同步机制、基于原语的片上互斥访问同步机制和基于满空标志位的细粒度同步机制;提出了粗粒度同步机制的评估标准和评估方法,并设计了量化评估程序.以片上同构众核处理器Godson-T模拟器和AMDOpteron商业片上多核处理器为平台,评估比较了提出的硬件支持的同步机制与基于原语的同步机制的性能.结果表明,硬件支持可以使得片上众核处理器的同步机制性能明显提高;在传统基于原语的同步机制中,大部分性能损失是由于负载不平衡和同步点的串行化操作而造成的等待时间. 徐卫志 宋风龙 刘志勇 范东睿 余磊 张帅关键词:硬件支持 微程序 RISC处理器中执行寄存器类型指令的方法和其系统 本发明涉及RISC处理器中执行寄存器类型指令的方法和系统,方法包括:步骤1,发现汇编代码中寄存器类型指令在执行时,所用类型寄存器的可用数目不足,则生成所述寄存器类型指令对应的宏指令,使用所述宏指令代替所述寄存器类型指令;... 安述倩 余磊 张浩 范东睿文献传递 LU分解在众核结构仿真器上的指令级调度研究 被引量:5 2011年 随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了形式化描述,验证了进行指令级调度的必要性。对处理器核内流水线进行详细分析,指出了指令级调度的一般性问题。提出了在众核结构上使用指令级调度和软件流水的方法。针对Splash2程序集里的LU分解算法,使用众核结构的硬件支持,在Scratched Pad Memory(SPM)上给出了调度指令的方案。在众核仿真器Godson-T上仿真了经过指令级调度后的算法,当使用64个线程处理512×512的矩阵时,程序性能达到调度前性能的4倍。 余磊 刘志勇 宋风龙 叶笑春关键词:计算机体系结构 加速比 指令级并行 LU分解 一种片上众核结构共享Cache动态隐式隔离机制研究 被引量:4 2009年 访存带宽是限制众核处理器性能提升的关键,将片上最后一级Cache设计为所有处理器核共享是必要的.在共享Cache中隔离放置冲突的数据,是提高共享Cache性能的关键.文中提出了缓存块链接的硬件方法,用于隔离共享Cache中不同线程之间的数据.文中基于时钟精准的片上众核结构模拟器,使用Splash2程序组和生物信息学中的任务,对所提机制进行了评估.实验结果表明,与传统共享Cache相比,使用缓存块链接机制时,使得共享Cache的冲突性缺失率降低约20%,而使得IPC平均提高了约10%. 宋风龙 刘志勇 范东睿 张军超 余磊关键词:共享CACHE 数据冲突 众核结构上分块LU分解算法的研究 2011年 针对科学计算中的经典程序LU分解进行了深入研究。在仔细分析Lu分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法。为了评估2Dscatter算法、BRX算法和DABP算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性。在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的。 余磊 刘志勇 马宜科 宋风龙 徐卫志 叶笑春关键词:计算机体系结构 加速比 负载均衡 LU分解 RISC处理器中执行寄存器类型指令的方法和其系统 本发明涉及RISC处理器中执行寄存器类型指令的方法和系统,方法包括:步骤1,发现汇编代码中寄存器类型指令在执行时,所用类型寄存器的可用数目不足,则生成所述寄存器类型指令对应的宏指令,使用所述宏指令代替所述寄存器类型指令;... 安述倩 余磊 张浩 范东睿众核结构上LU分解算法负载均衡的研究 随着计算机体系结构的发展,众核体系结构越来越成为科研人员关注的焦点。众核技术的发展要求能够利用片上大规模的并行资源,高效加速应用程序的性能。本文针对科学计算中的经典程序LU分解进行了深入研究。通过仔细分析算法,指出了2D... 余磊 刘志勇 范东睿 宋风龙关键词:计算机体系结构 负载均衡 文献传递