郝萌
- 作品数:31 被引量:6H指数:1
- 供职机构:哈尔滨工业大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 高性能并行程序性能预测和能效优化
- 随着高性能计算的发展,HPC系统的规模和复杂度大幅度增加,其计算能力从P级向E级发展。这就为并行程序的移植和优化带来了极大的挑战。并行程序向大规模HPC系统移植时通常面临着执行效率低、可扩展性差的问题,难以充分利用硬件系...
- 郝萌
- 基于国产DCU异构平台的图匹配算法移植与优化
- 2024年
- 子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅度减少存储开销,提升子图匹配性能。但由于平台底层硬件架构和编译环境的不同,GENEVA无法直接应用到国产DCU异构平台。为了解决该问题,提出了GENEVA面向国产DCU的移植和优化方案。IO时间开销是GENEVA算法主要的性能瓶颈,文中采用锁页内存、预加载、调度器3种优化策略来突破该瓶颈。其中,锁页内存技术避免了从可分页内存到临时锁页内存的额外数据传输,在DCU平台上大幅度减少了IO传输的时间开销;预加载技术将IO数据传输与DCU核函数计算重叠,掩盖了IO时间开销;调度器在满足预加载需求的同时,减少了冗余数据的传输。在3个不同规模的真实数据集上进行实验,结果表明,采用优化策略后算法性能显著提高。在92.6%的测试用例上,经过优化的GENEVA-HIP算法在国产DCU平台的执行时间比移植前的GENEVA算法在GPU服务器的执行时间短。在较大规模的数据集上,优化的GENEVA-HIP算法在DCU平台上的执行时间相比移植前的GENEVA算法在GPU服务器的执行时间减少了52.73%。
- 郝萌田雪洋鲁刚钊刘义张伟哲何慧
- 关键词:异构平台HIP
- 零知识证明硬件加速研究综述
- 2024年
- 零知识证明(zeroknowledge proofs,ZKP)是一种允许证明者向验证者证明某一陈述正确性而无需泄露任何其他信息的密码学协议.主要介绍了零知识证明的加速研究,尤其关注了基于二次算术程序(QAP quadratic arithmetic program)和内积证明(inner product argument,IPA)的ZKP.研究表明,零知识证明的计算效率可以通过硬件加速技术显著提高,包括使用GPU,ASIC,FPGA等.首先介绍了零知识证明的定义与分类及目前零知识证明应用所遇到的困难.其次详细讨论了不同硬件系统的加速方法、实现原理及其相对于传统CPU的性能提升.例如,cuZK和GZKP利用GPU实现了多标量乘法(multiscalar multiplication,MSM)和数论变换(number theoretic transform,NTT),而PipeZK,PipeMSM,BSTMSM则通过ASIC和FPGA加速这些计算过程.此外,也提到了零知识证明在区块链中隐藏交易细节等方面的应用案例,如ZCash的隐秘交易.最后,提出了未来研究的方向,包括加速更多类型的ZKP和将硬件加速应用到实际的应用场景中,以解决效率低下问题,推动零知识证明技术的广泛应用.
- 谢明东郝萌杨洪伟何慧张伟哲
- 关键词:零知识证明并行计算
- 一种基于深度强化学习的GPU动态能源效率优化运行时方法及系统
- 本发明公开了一种基于深度强化学习的GPU动态能源效率优化运行时方法及系统,涉及效率优化技术领域。本发明的技术要点包括:将GPU中应用程序工作负载的环境状态当作优先经验回放的双深度Q网络的状态,将GPU功率配置当作优先经验...
- 张伟哲王一名郝萌何慧
- 一种无模型的GPU在线能效优化方法及系统
- 一种无模型的GPU在线能效优化方法及系统,属于计算机能效优化技术,为了实现GPU在线自动能效优化而提出。技术要点:性能基准在线测量,在默认频率配置下全面收集GPU kernel活动信息,设计覆盖度指标,评估收集信息的完备...
- 张伟哲王法瑞郝萌何慧
- 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统
- 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统,属于并行程序能耗优化技术领域,目的是自动地优化并行应用程序的能耗,并且不需要领域专家知识,对程序是透明的。本发明的技术要点包括:程序的阶段根据工作负载的特征,分...
- 张伟哲王一名郝萌何慧鲁刚钊王法瑞方滨兴
- 一种基于内存和Swap空间的虚拟机内存动态管理系统及方法
- 本发明涉及虚拟机内存管理领域,具体涉及一种基于内存和Swap空间的虚拟机内存动态管理系统及方法,本发明为了解决现有的虚拟机内存调度算法在使用Swap空间时会造成系统性能损耗,并且在虚拟机内存监控中仅使用带内监控,使得虚拟...
- 张伟哲何慧王德胜谢虎成刘亚维余翔湛郝萌鲁刚钊白恩慈
- 文献传递
- 一种针对科学计算程序静态分析性能的预测代价优化方法
- 一种针对科学计算程序静态分析性能的预测代价优化方法,本发明涉及针对科学计算程序静态分析性能的预测代价优化方法。本发明是要解决静态分析方法的预测代价大,引入误差的问题而提出的一种针对科学计算程序静态分析性能的预测代价优化方...
- 张伟哲郝萌何慧谢虎成韩硕王学惠鲁刚钊
- 文献传递
- 一种基于节点选择的异构图迁移学习方法
- 本发明公开了一种基于节点选择的异构图迁移学习方法,涉及迁移学习技术领域,用以对源网络中的节点进行数值量化评估并选择与目标网络更相关且具有高质量的节点,进而提高模型在目标网络上的性能。本发明的技术要点包括:利用特定语义的特...
- 杨洪伟何慧王文奇张伟哲郝萌
- 一种基于GAN的高仿真蜜罐实现方法及系统
- 本发明公开了一种基于GAN的高仿真蜜罐实现方法及系统,涉及网络安全技术领域。本发明的技术要点包括:获取攻击者请求报文;利用基于GAN的高仿真蜜罐对攻击者请求产生正确应答,进而生成响应报文;其中,基于GAN的高仿真蜜罐依靠...
- 何慧汤浩蒙俊雄张伟哲郝萌杨洪伟