您的位置: 专家智库 > >

张保

作品数:11 被引量:14H指数:2
供职机构:西安交通大学更多>>
发文基金:国家高技术研究发展计划中央高校基本科研业务费专项资金国家自然科学基金更多>>
相关领域:自动化与计算机技术电气工程更多>>

文献类型

  • 5篇专利
  • 4篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 1篇电气工程

主题

  • 6篇GPU
  • 3篇数据复用
  • 3篇显存
  • 3篇复用
  • 3篇CPU
  • 2篇动态搜索
  • 2篇异构
  • 2篇示波器
  • 2篇数据访问
  • 2篇数字示波器
  • 2篇搜索
  • 2篇搜索树
  • 2篇图形处理器
  • 2篇剖分
  • 2篇微米
  • 2篇激振器
  • 2篇U系统
  • 2篇采样
  • 2篇采样频率
  • 2篇测试系统

机构

  • 11篇西安交通大学

作者

  • 11篇张保
  • 8篇董小社
  • 5篇李亮
  • 4篇曹海军
  • 4篇朱正东
  • 4篇白秀秀
  • 4篇颜康
  • 3篇张兴军
  • 2篇曹亮
  • 2篇邵兆申
  • 2篇陈刚
  • 2篇李丹
  • 1篇刘超
  • 1篇刘超
  • 1篇梅一多
  • 1篇李丹
  • 1篇冯景华
  • 1篇刘袁

传媒

  • 3篇西安交通大学...
  • 1篇高技术通讯
  • 1篇2013全国...

年份

  • 1篇2019
  • 1篇2017
  • 1篇2016
  • 3篇2013
  • 3篇2012
  • 2篇2011
11 条 记 录,以下是 1-10
排序方式:
面向图形处理器重叠通信与计算的数据划分方法被引量:5
2011年
针对"主核心+协处理器"式异构并行系统采用数据平均划分再分批执行的方法来解决主协式处理架构的额外通信开销时未能充分利用系统资源的问题,提出了一种新的数据比例划分方法.结合系统通信带宽和图形处理器(GPU)的计算能力,将应用数据按比例划分为大小不同的数据块后分批提交给GPU处理,使系统的传输资源PCI-E总线和计算资源GPU在一段时间内并行工作,从而实现了应用通信与计算的重叠.在处理按照比例划分的数据块过程中,尽可能充分利用系统的传输资源和计算资源,以减少数据传输和计算的相互等待时间.实验结果表明,采用数据比例划分方法后的应用性能明显提高,可以有效地重叠通信与计算时间,矩阵相乘和快速傅里叶变换总执行时间比未划分时分别减少了5%和30%左右,比平均划分时分别减少了3%和6%左右.
张保曹海军董小社李丹胡雷钧
关键词:图形处理器数据划分
一种基于动态搜索的运行时GPU显存级数据复用优化方法
本发明公开了一种基于动态搜索的GPU显存级数据复用优化方法,首先,将已经执行的GPU计算任务的数据访问抽象为动态搜索树的叶子节点,将循环等抽象为搜索树的内部节点;其次,对GPU和CPU计算任务对数据的访问,在运行时逆向回...
董小社李亮张兴军颜康张保白秀秀朱正东
文献传递
一种面向GPU的数据流处理方法
本发明公开了一种面向GPU的数据流处理方法,首先,在CPU和GPU组成的异构并行系统中运行待处理的数据密集型计算模块,得到拷入时间Ti、计算时间Tc、拷回时间To;然后,根据三部分运行时间计算如下比例关系:a=Tc/Ti...
董小社张保曹海军张兴军冯景华李亮刘超李丹白秀秀刘袁
文献传递
基于剖分的CPU-GPU系统性能优化技术研究
张保
关键词:异构多核剖分GTC
一种超微器件振动固有频率测试系统及测试方法
一种超微器件微小振动固有频率测试系统和方法,该测试系统包括依次连接的信号发生器、功率放大器、激振器、激光位移计组和数字示波器;其中激光位移计组由并联的两个激光探头组成,并事先调整采样频率为所要测量超微器件振动频率范围最高...
陈刚曹亮邵兆申张保
文献传递
基于时间反馈的CPU-GPU计算任务划分方法
针对CPU-GPU 异构并行系统处理计算任务时未能充分利用系统计算资源,造成CPU 计算资源浪费的问题,本文提出一种基于时间反馈的自适应计算任务划分方法。该方法结合主处理器CPU 与协处理器GPU 的计算能力将计算任务进...
颜康董小社李亮朱正东张保
关键词:反馈调节
一种基于动态搜索的运行时GPU显存级数据复用优化方法
本发明公开了一种基于动态搜索的GPU显存级数据复用优化方法,首先,将已经执行的GPU计算任务的数据访问抽象为动态搜索树的叶子节点,将循环等抽象为搜索树的内部节点;其次,对GPU和CPU计算任务对数据的访问,在运行时逆向回...
董小社李亮张兴军颜康张保白秀秀朱正东
文献传递
应用动态生成树的GPU显存数据复用优化被引量:1
2013年
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
李亮王恩东朱正东颜康张保董小社
关键词:数据复用数据传输
CPU-GPU系统中基于剖分的全局性能优化方法被引量:10
2012年
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右.
张保董小社白秀秀曹海军刘超梅一多
关键词:全局优化
一种超微器件振动固有频率测试系统及测试方法
一种超微器件微小振动固有频率测试系统和方法,该测试系统包括依次连接的信号发生器、功率放大器、激振器、激光位移计组和数字示波器;其中激光位移计组由并联的两个激光探头组成,并事先调整采样频率为所要测量超微器件振动频率范围最高...
陈刚曹亮邵兆申张保
共2页<12>
聚类工具0