靳国杰
- 作品数:8 被引量:16H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种动态二进制翻译中间接分支目标地址查找算法被引量:1
- 2014年
- 如何提高性能是动态二进制翻译中的核心研究问题.动态二进制翻译技术以分支指令结尾的基本块是翻译和执行的基本单元,基本块之间的跳转关系由分支指令确定.间接分支的目标地址在运行时才能确定,优化比较困难.已有工作表明间接分支目标地址的处理是影响动态二进制翻译系统性能的重要因素.经过我们的实验分析表明间接分支的目标地址分布具有较好的局部性,在此基础上提出一个带私有缓存的间接分支目标的查找算法,利用私有缓存对间接分支的目标地址进行预测,分支目标良好的局部性带来了高的预测成功率,从而减少了上下文切换的次数,并且使得X86体系结构下SPEC CPU2000 INT测试集程序在龙芯平台上翻译执行时间平均减少了10%-20%.
- 廖银姜海涛孙广中靳国杰陈国良
- 关键词:动态二进制翻译
- 一种基于封装器的Web文档构件化技术被引量:2
- 2009年
- 本文提出了一种使用封装器将Web文档转化为软件构件的方法,并分析了其在软件复用方面的优势。最后结合专业技术职务申报系统实例,给出了该开发方法的具体应用。
- 张洪鹏靳国杰尹宝林
- 关键词:软件复用封装器WEB文档
- 基于双TLB的二进制翻译访存性能优化
- 2015年
- 现有二进制翻译系统主要采用纯软件的方法实现访存指令模拟,用于目标访存指令的翻译后代码规模过高,导致模拟效率低下。针对该问题,提出一种高效的龙芯二进制翻译系统,设计一种双翻译后备缓冲(TLB)结构,通过在CPU核中新增一个专门用于转换宿主机地址的硬件TLB,实现由硬件直接进行地址转换,并通过降低用于X86访存指令的翻译后代码规模减少模拟开销。实验结果表明,与采用纯软件模拟方法的二进制翻译系统相比,优化后的内存拷贝性能提高约100倍,模拟X86Linux内核的启动时间缩短19.12%。
- 李晖王振华靳国杰
- 关键词:二进制翻译命中率龙芯处理器
- 动态二进制翻译中间接跳转的热点跟踪及其一致性维护优化
- 2014年
- 针对动态二进制翻译(DBT)系统对地址转换过程进行一致性维护的基于锁操作的传统方法会在单线程和多线程执行中都造成严重的执行开销的问题,提出了优化一致性维护的机制,通过跟踪热点跳转,在命中率较高的热点跳转的地址转换过程中,避免使用锁操作,仅在检测到并发读写冲突时进行冗余的地址转换。为实现上述检测过程,提出了指令执行时序和地址转换数据的优化设计方法。在基于Godson-3处理器的X86模拟平台上,实验结果显示,优化机制极大地提高了二进制翻译的执行效率,在SPEC CPU2000/2006单线程测试中能够降低平均27.7%(1.8%到58.5%)的执行开销,在NPB多线程测试中能够降低平均18.4%(3.3%到64.6%)的执行开销。
- 张晓春高翔郭崎刘宏伟靳国杰孟小甫
- 关键词:多线程
- 动态二进制翻译中全寄存器直接映射方法被引量:13
- 2011年
- 二进制翻译是不同体系结构之间软件移植的重要手段。体系结构和硬件环境上的差别,可以通过二进制翻译系统来弥补,在翻译过程中往往使用多条本地指令模拟一条目标指令,翻译代码规模随之显著增加,从而导致被翻译程序的执行效率下降。寄存器作为处理器和内存交换信息的重要存储部件,寄存器的模拟器方式对于程序的性能有着至关重要的影响。为了提高特定平台翻译后代码的执行效率,提出了在动态二进制翻译机制中使用全部寄存器直接映射方法,详细分析了二进制翻译中的上下文切换原理和寄存器访问范围,为异构平台之间寄存器直接映射提供方法指导。利用QEMU模拟器,把x86架构的8个通用寄存器全部的直接映射到MIPS架构的对应寄存器,在此基础上,进行大量的指令翻译规则的简化。实验数据表明,该方法可以有效简化指令翻译,降低代码膨胀率,使得SPEC CINT 2000测试程序在龙芯CPU上翻译后代码运行时间下降了30%-40%。
- 廖银孙广中姜海涛靳国杰陈国良
- 关键词:动态二进制翻译QEMU
- NUMA结构的高效实时稳定的垃圾回收算法
- 2015年
- 针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机制的堆空间布局,然后通过控制GC过程中扫描活跃对象阶段的初始根对象选取、动态负载均衡阶段截取任务队列的选取以及复制活跃对象阶段对象复制位置的选取,大大减少GC过程中的远程访问次数。这种改进的GC机制对所有NUMA结构具有通用性。以Godson-3处理器的NUMA平台为例进行的实验结果显示,优化的GC机制极大地缩短了GC的时间,而且提高了应用程序的性能以及稳定性。在SPECjvm2008测试中,GC时间平均缩短了14.6%(GC总时间缩短4.1%-41.58%),应用程序的性能平均提升了4.68%(最高提升17.8%),应用程序的性能稳定性提升了76.2%。
- 廖彬傅杰靳国杰王一光王磊王磊章隆兵
- 关键词:动态负载均衡
- 应用级粒度的可集成构件重用性提升方法被引量:1
- 2011年
- 提出了一种用于提高软件构件重用能力的构件构造方法。与当前研究中主要以软件实现逻辑表达一项应用用例的功能封装单元相比,该方法以应用功能层面的一类需求范畴为构件的表达目标,将业务用例以可配置的描述内容交由构件进行解释执行。通过提升构件粒度,应用级构件单元以更高的重用能力支持更为广泛的用例集合。基于这一原理设计了构件模型以及相应的构件库扩展和组装机制。通过所建立的构件集合原型,在实际开发案例中的应用验证了该方法的有效性。重用性的度量结果表明,所提方法将软件构件的重用性在特定领域中提高到96.6%~99.4%。
- 靳国杰尹宝林赵启阳
- 关键词:软件开发
- 二进制翻译后端指令分级索引策略
- 2013年
- 随着硬件平台的多元化,软件兼容性问题日益突出,二进制翻译技术是解决软件兼容性问题的重要手段.鉴于二进制翻译系统大部分执行时间消耗在后端指令的查找和执行过程中,高效的指令索引策略可以减少系统的指令查找开销,提高系统的整体效率.在对二进制翻译系统后端指令局部性特征进行统计分析的基础上,设计了一种能充分挖掘现代计算机系统硬件性能的二进制翻译指令分级索引策略.该策略结合二进制翻译系统后端指令特殊的局部性特征,使用针对性的替换算法对后端指令进行缓存,降低了系统的指令查找开销.在引入了LIIS索引策略后,开源二进制翻译系统QEMU的后端指令查找时间减少了70%,整个系统执行效率提高了15%.
- 姜海涛徐云廖银靳国杰陈国良
- 关键词:虚拟机CACHEQEMU