您的位置: 专家智库 > >

苏俊杰

作品数:13 被引量:30H指数:4
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:安徽省自然科学基金高等学校学科创新引智计划安徽省教育厅项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 9篇期刊文章
  • 4篇专利

领域

  • 10篇自动化与计算...

主题

  • 4篇代码
  • 4篇中间代码
  • 2篇调度
  • 2篇调用图
  • 2篇多线程
  • 2篇虚函数
  • 2篇虚拟化
  • 2篇虚拟化技术
  • 2篇冗余
  • 2篇线程
  • 2篇相关信息
  • 2篇函数
  • 2篇函数调用
  • 2篇函数调用图
  • 2篇函数指针
  • 2篇和函数
  • 2篇SIMD
  • 2篇ANDROI...
  • 2篇遍历
  • 2篇插桩

机构

  • 13篇中国科学技术...
  • 3篇安徽新华学院
  • 2篇安徽省计算与...
  • 1篇中国科学院

作者

  • 13篇顾乃杰
  • 13篇苏俊杰
  • 3篇贺爱香
  • 3篇刘博文
  • 3篇张旭
  • 2篇张帆
  • 1篇黄章进

传媒

  • 3篇小型微型计算...
  • 2篇计算机工程
  • 1篇中国科学技术...
  • 1篇计算机应用与...
  • 1篇计算机系统应...
  • 1篇计算机工程与...

年份

  • 1篇2024
  • 1篇2022
  • 1篇2021
  • 1篇2020
  • 2篇2019
  • 2篇2018
  • 5篇2017
13 条 记 录,以下是 1-10
排序方式:
适用于虚函数和函数指针的静态函数调用图构建方法
本发明公开了一种适用于虚函数和函数指针的静态函数调用图构建方法,其步骤包括:1获取源程序的中间代码;2获取中间代码中的关键信息,所述关键信息包括基本块顺序队列以及虚函数相关信息;3基于所述关键信息,对所述中间代码进行模拟...
顾乃杰张帆苏俊杰
文献传递
一种多线程应用场景下的访存指令插桩优化方法
本发明公开了一种多线程应用场景下的访存指令插桩优化方法,是通过基于程序中间代码的静态分析过程从而剔除对涉及非共享内存的访存指令的冗余插桩,该方法具体包括:1、获取中间代码;2、遍历所有模块,函数,基本块及指令;3、获取指...
顾乃杰刘倩玉苏俊杰
文献传递
基于LXC的Android系统虚拟化技术被引量:1
2017年
虚拟化技术的研究正逐渐从高性能服务器端转向移动智能设备领域.现有的虚拟化方案多是采用多内核方案,系统负载高,效率低.针对车载系统等平台多屏显示以及资源受限等问题,本文提出一种基于容器技术的Android轻量级虚拟化方案.该方案通过利用Namespace资源隔离机制和Cgroup资源分配机制,使得ARM平台在资源使用较少的同时,能够同时启动多个Android虚拟机,并且各虚拟机上的屏幕显示相互独立.测试结果表明,该方案的内存占用率较双系统方案降低了7%,而平均CPU使用率较原生Android系统仅增加了1%.
谷德贺顾乃杰刘博文刘博文贺爱香
关键词:虚拟化技术资源分配ARM平台虚拟机
移动平台Android操作系统虚拟化技术的实现被引量:10
2017年
虚拟化技术的研究正逐渐从服务器端转向移动智能设备领域。现有的虚拟化架构需要在物理硬件层和虚拟系统间进行大量的指令翻译,开销大,效率低。针对这一问题,提出了一种轻量级的移动操作系统虚拟化架构。通过在Linux内核命名空间机制的基础上扩展Driver命名空间框架,实现了多个虚拟Android系统的同时运行。此外,针对多个虚拟系统同时访问一套硬件设备发生冲突的问题,设计了通用的active-inactive模型来保证虚拟系统间对硬件设备的隔离复用。实验结果表明,虚拟后的Android系统在CPU使用率上并没有增加额外的开销,在内存使用量上减少了6.7%,此虚拟化架构具有很好的通用性与实用性。
刘博文顾乃杰谷德贺苏俊杰
关键词:ANDROID
一种多线程应用场景下的访存指令插桩优化方法
本发明公开了一种多线程应用场景下的访存指令插桩优化方法,是通过基于程序中间代码的静态分析过程从而剔除对涉及非共享内存的访存指令的冗余插桩,该方法具体包括:1、获取中间代码;2、遍历所有模块,函数,基本块及指令;3、获取指...
顾乃杰刘倩玉苏俊杰
文献传递
Linux调度器免锁优化方法研究被引量:3
2017年
Linux操作系统被广泛用于各领域,多核环境下Linux调度器依靠自旋锁保证其正确运行,这给调度器带来了严重的锁竞争.在分析Linux调度器的基础上,对其提出三个层次的免锁优化方法:基础优化、调度行为优化和基于上层应用特征的参数调优.基础优化尝试从代码层面直观地缩小程序的锁冲突域;调度行为优化针对进程创建过程中的唤醒操作提出了一种新进程延迟唤醒方法,有效地减少了进程创建过程中的锁竞争;基于上层应用特征的参数调优可以在对内核修改很小的情况下完成调度器性能提升.
张旭顾乃杰苏俊杰
关键词:LINUX内核调度器自旋锁
一种用于软件预取的访存轨迹采样算法
2024年
软件预取作为提升数据存取性能的一种重要技术,得到了广泛的关注和应用。在软件预取的研究中,往往需要使用访存轨迹分析结合采样算法来筛选出存在缓存未命中的访存指令作为预取目标。然而,传统的迸发采样算法无法区分不同类型的轨迹信息,且容易遗漏访问次数较少的指令。针对以上问题,提出一种基于单遍聚类和分层采样的访存轨迹采样算法。首先提取访存轨迹信息特征;然后利用单遍聚类方法并依据特征相似程度进行访存信息聚类;最后以聚类为基础进行分层采样,根据缓存未命中率对轨迹中不同的部分合理分配注意力来调整采样比,有效缓解了规模较小类别的采样遗漏情况。实验结果显示,在选择的8个测试程序上,相比于传统迸发采样算法,所提算法可平均多覆盖15.70%的缓存未命中指令,基于所提算法的预取平均可额外减少20.76%的缓存未命中数和3.51%的程序运行时间。
刘大兴顾乃杰黄章进苏俊杰齐东升
一种高效通用的TCP尾部丢包恢复算法被引量:1
2017年
随者互联网时代的到来,如何提升互联网应用的交互性能逐渐成为时下的研究热点;而在当今的互联网环境中,网络带宽已经不是瓶颈,网络时延成为影响应用交互性能的关键因素.作为互联网时代的主要应用,Web应用的网络时延受到TCP尾部丢包现象的严重影响.Tail Loss Probe算法是一种通过发送探针包来触发恢复的高效易部署的TCP尾部丢包恢复算法,但其需要修改现有的TCP加速机制,存在影响互联网稳定性的风险.针对Tail Loss Probe算法存在的不足,提出一种Double Tail Loss Probe算法,该算法对不同的尾部丢包模式进行细化处理且在适当时机下发送两个探针包以加速恢复并实现与现有TCP机制的友好兼容,从而保证互联网数据流通的稳定性.实验表明,在不同的丢包粒度和传播时延下,Double Tail Loss Probe算法都展现出更快的恢复速度;尤其在丢包粒度较大时,相比Tail Loss Probe,该算法取得了约20%的性能提升.
张旭顾乃杰谷德贺刘博文苏俊杰
关键词:TCP
基于ARM SVE的FFT算法向量化研究被引量:2
2022年
快速傅里叶变换(Fast Fourier Transform,FFT)是信号处理、图像处理等领域的重要研究工具.可伸缩向量扩展(Scalable Vector Extension,SVE)是ARM处理器推出的基于ARMv8-A体系架构的新一代SIMD指令集,支持位宽为128位-2048位的向量寄存器和向量长度无关(Vector Length Agnostic,VLA)编程模型,具有很好的数据并行性和软件可移植性,适用于高性能计算、机器学习等领域.目前基于ARM SVE的FFT算法的研究尚未充分挖掘其架构特性和计算资源,本文针对数据规模为2的幂次的一维复数FFT,结合SVE谓词驱动的循环控制、非线性访存、复数运算等特性对算法做出了改进.实验结果表明,与FFTW库基于NEON的向量化实现相比,本算法性能有明显提升,在向量长度为1024位时,平均性能提升5.83倍,最高性能提升9.22倍.
李凤娇顾乃杰齐东升苏俊杰
关键词:软件性能优化
基于多核ARM体系结构的基础函数优化方法被引量:5
2018年
为充分利用嵌入式多核ARM微处理器体积小、功耗低、成本低、性能高的优点,以此提高程序响应速度,研究ARM体系结构及基于该体系结构基础函数的优化问题。基于ARM Cortex-A72平台,结合ARM v8体系结构特点,对Bionic库中字符串和内存处理函数进行分析。实验结果表明,采用整字处理、循环展开、特殊指令等技术进行程序级优化后,Bionic库中常用基础函数的性能在ARM Cortex-A72平台上均有不同程度的提升。
贺爱香贺爱香顾乃杰
关键词:体系结构
共2页<12>
聚类工具0