国家自然科学基金(60325205)
- 作品数:25 被引量:148H指数:5
- 相关作者:胡伟武李祖松许彤唐志敏刘志勇更多>>
- 相关机构:中国科学院中国科学院研究生院中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 龙芯2号处理器系统优化关键技术被引量:5
- 2006年
- 系统软件作为处理器和应用程序之间的接口,对于充分利用处理器的特性来维护处理器与应用程序的稳定性和提高应用程序的性能起着极其重要的作用·描述了在Linux内核中解决龙芯2号处理器的Cache别名问题的方法以及通过增加页的大小、软TLB和FAST TLB REFILL的方法减小TLB失效的性能损失,还有Uncache Accelerate对媒体播放软件的加速·实验结果表明,在系统软件中增加这些方法的支持,对系统的稳定性和性能都有较大的好处·
- 伍鸣张福新林伟许先超袁楠王剑
- 关键词:龙芯2号处理器
- 龙芯1号处理器的故障注入方法与软错误敏感性分析被引量:38
- 2006年
- 在纳米级制造工艺下以及在航天等特殊应用场合中,可靠性将是处理器设计中的一个重要考虑因素.以龙芯1号处理器为研究对象,探讨了处理器可靠性设计中的故障注入方法,并提出了一种同时运行两个处理器RTL模型的故障注入与分析方法,可以实现连续快速的处理器仿真故障注入.在此基础上,进一步分析了龙芯1号处理器的软错误敏感性,通过快速注入大约30万个软错误,保证了分析结果具有较好的统计意义,可以有效指导后续的容错与可靠性设计.
- 黄海林唐志敏许彤
- 关键词:软错误
- 龙芯2号微处理器浮点除法功能部件的形式验证被引量:4
- 2006年
- 基于决策图的字级模型检验方法虽然能完全验证运算电路,但它从有缺陷的设计中发现系统规范的反例所需时间较长.而基于SAT的有界模型检验方法虽然能较快地发现反例,但它不支持包含数学公式的系统规范,因而难以用于验证运算电路.提出了基于SAT的字级模型检验方法,该方法将CNF扩展为能混合布尔公式和数学公式的E-CNF用以表示设计和系统规范,并对有界模型检验工具和SAT求解器进行字级的扩展,使它们能分别生成和处理E-CNF.龙芯2号微处理器浮点除法功能部件验证同时采用了基于PHDD和基于SAT的字级模型检验方法.数据表明,基于SAT的字级模型检验方法能快速地发现运算电路中的设计缺陷.两种方法互为补充,在能完全验证设计的同时显著缩短了设计周期.
- 陈云霁马麟沈海华胡伟武
- 关键词:SATCNF
- 基于VPM和随机激励的处理器核仿真建模
- 2010年
- 为提高处理器核仿真模型的效率,提出基于SimpleScalar架构对龙芯1号处理器进行虚拟处理器模型行为建模,IPC平均误差为2.3%,速度达到每秒1 000 000条指令。基于可控随机事件机制实现的总线功能模型可以为片上系统(SoC)设计提供激励主动生成方案和片上互连验证功能。实验结果证明,该方法对处理器IP仿真建模具有普适意义,能够被无缝融入SoC流程中。
- 许彤张仕健吕涛
- 关键词:总线功能模型
- 一种基于统计特性估算串扰概率的方法
- 2006年
- 该文所提出的基于统计特性估算总线串扰概率的方法与以往基于数据流的方法相比,具有更短的运行时间,且精度相当,可以更有效地为综合工具采取相应避免措施提供参考依据。
- 徐君范宝峡
- 关键词:串扰ARMA模型
- 针对龙芯2号结构特征的GCC优化被引量:1
- 2007年
- 根据龙芯2号处理器体系结构的特点,引入浮点乘加、条件move和预取等一系列特殊指令,并且对开源编译器GCC进行修改使其支持这些特殊指令,同时对生成对应指令的算法进行了调整和优化.实践中已经证明,特殊指令的引入和相应的优化比较好的提升了应用程序的性能,达到了预期的效果.
- 邹琼董峻峰
- 关键词:龙芯2号
- 基于约束的处理器接口随机测试模型被引量:1
- 2007年
- 提出了一种处理器接口测试模型,并给出了具体实现方案。该测试模型将仿真测试的方法应用于处理器接口测试,在激励生成中采用基于约束的随机测试生成方法。结果表明,基于约束的处理器接口随机测试模型的覆盖率达到83.68%,能够快速有效地完成处理器接口部件的功能验证。
- 郇丹丹李祖松刘志勇
- 关键词:接口仿真龙芯2号
- 一种快速的滑动标记缩并垃圾收集算法被引量:1
- 2008年
- Java语言完全面向对象,因此对象局部性是衡量Java虚拟机性能的重要指标.在Java虚拟机中,由垃圾收集算法负责检测并且回收不再使用的对象,它直接影响着Java程序的性能.保持对象分配序能够提供最佳的局部性.滑动标记缩并算法正是基于这一原则,但是传统上的设计使得算法的效率很低.本文提出一种快速的滑动标记缩并算法,它通过位图、活块池和块内偏移表来简化算法,大大的降低了开销.实验结果表明,快速的滑动标记缩并算法使得标准工业测试程序SPECJVM98的性能在Pentium4上有不同程度的提高,最高达到8.9%;同时程序的局部性也优于线性标记缩并算法,与深度遍历序相比,DTLB(Data Translation Lookaside Buffer)与2级Cache失效率改善最多分别为11%和13.6%.
- 邹琼章隆兵
- 关键词:垃圾收集位图
- 一种向分支指令后插入冗余指令的容错微结构被引量:3
- 2007年
- 随着深亚微米工艺的广泛应用,瞬态故障已成为芯片失效的主要原因.文中提出了一种向分支指令后插入冗余指令的容错微结构,利用分支误预测浪费的处理带宽,降低了冗余执行导致的性能损失.实验结果表明,该技术的性能损失在6%~31%之间,平均为21%,明显低于MBI技术而和DIE技术的性能损失相当.该技术能够检测流水线上各阶段发生的瞬态故障并能恢复处理器状态,故障检测延时短,需要的硬件开销也较小,非常适合提高带有简单预测机制的嵌入式微处理器的容错能力.
- 张仕健胡伟武
- 关键词:瞬态故障时间冗余容错嵌入式微处理器
- 基于龙芯2号的Java虚拟机的移植与优化被引量:6
- 2007年
- Java语言作为一种跨平台的编程语言在企业应用开发、桌面应用开发及嵌入式开发上获得了广泛的应用。为了在龙芯上运行Java程序,将Sun HotSpot Java虚拟机移植到了Linux/龙芯2上,该文描述了移植过程中的主要工作、遇到的问题及解决的方法和优化工作。
- 刘超
- 关键词:JAVAJAVA虚拟机LINUX龙芯2号JIT