刘帅
- 作品数:22 被引量:14H指数:2
- 供职机构:西安科技大学通信与信息工程学院更多>>
- 发文基金:国家自然科学基金陕西省自然科学基金更多>>
- 相关领域:电子电信矿业工程自动化与计算机技术建筑科学更多>>
- 巷旁混凝土充填体全服务周期稳定性监测预警系统及方法
- 本发明公开了一种沿空留巷巷旁混凝土充填体全服务周期稳定性监测预警系统及方法,系统包括巷旁混凝土充填体稳定性监测预警平台、专家评价系统、超声波信号预警模块、微震信号预警模块、巷道矿压显现预警模块。通过将各个采集单元采集的实...
- 高喜才王琪马腾飞赵程刘帅范凯王灿华肖前昌胡彬
- 文献传递
- 倾斜层状煤岩体力-声-光-波一体化测试装置及方法
- 本发明公开了一种倾斜层状煤岩体力‑声‑光‑波一体化测试装置及方法,通过电液伺服岩石力学加载系统向对倾斜层状煤岩体试件加载应力,倾斜层状煤岩体试件受应力的轴向载荷、位移和侧向位移变形超声波形信息和超声波形、波速、幅值、频率...
- 高喜才赵程王琪马腾飞刘帅范凯王灿华肖前昌胡彬
- 文献传递
- 一种地表沟谷径流下煤层局部充填减损开采方法
- 本发明公开了一种地表沟谷径流下煤层局部充填减损开采方法,根据矿区基础资料,确定工作面导水裂隙带高度及涌水量,预测隔水层破坏程度及突水危险性;确定过沟谷前最近局部充填开采、过沟谷后正常开采位置,采用地表沟谷径流下煤层三段式...
- 高喜才马腾飞张锡琛刘帅肖江刘洋袁博迪徐自豪王克玄张成
- 文献传递
- 基于阵列处理器的最小均方误差检测算法并行设计与实现被引量:2
- 2022年
- 针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较为简单的数据依赖关系,设计时间上和空间上可以高度并行的流水线加速方案;其次,根据MMSE算法中Gram矩阵计算和匹配滤波计算模块相对独立的特点,设计模块化并行映射方案;最后,基于Xilinx Virtex-6开发板对映射方案进行实现并统计其性能。实验结果表明,该方法在MIMO规模为128×4、128×8和128×16的正交相移键控(QPSK)上行链路中,加速比分别2.80、4.04和5.57;在128×16的大规模MIMO系统中,可重构阵列处理器比专用硬件减少了42.6%的资源消耗。
- 刘帅蒋林李远成山蕊朱育琳王欣
- 关键词:最小均方误差算法阵列处理器可重构
- 一种金属粉末加工用降温装置
- 本发明涉及金属粉末加工技术领域,具体是涉及一种金属粉末加工用降温装置,包括粉末容纳底壳、粉末容纳上壳、升降装置、辅助搅拌装置、供水装置和接料盒,粉末容纳上壳固定在粉末容纳底壳上,粉末容纳底壳安装在升降装置上,升降装置上设...
- 李玉华杨鑫刘帅庞智博殷朋
- 文献传递
- 面向通信基带信号处理的可重构阵列处理器研究与设计
- 可重构结构具有灵活的信息配置能力,在处理计算密集型和访存密集型应用时拥有巨大潜力。移动通信技术中新兴应用的出现对通信基带信号处理的硬件性能提出了更高的要求,在并行计算领域占有优势的可重构架构成为实现基带信号处理算法的理想...
- 刘帅
- 关键词:并行化计算粗粒度
- 一种高温蒸气压裂原位热解富油煤分采系统及方法
- 本发明公开了一种高温蒸气压裂原位热解富油煤分采系统及方法,确定富油煤井工原位热解开采实施路径,建立高温高压蒸气制备站、热解油气收集与分离系统;自地面开掘开拓巷道,划分原位热解反应区,开掘热解采区平巷、高温蒸气注入井、垂直...
- 高喜才张锡琛刘帅夏欢宁佳瑞张俊博陈宇竹邹尚坤
- 可重构结构下卷积神经网络加速研究与设计被引量:2
- 2023年
- 针对卷积神经网络(CNN)推理过程中计算量大、耗时长及硬件资源消耗高的问题,提出基于可重构阵列处理器的CNN加速设计方案。利用神经网络信息分布式存储特点,将处理元(PE)作为重构基本模块设计输入数据复用模式,减少内存访问次数从而加速网络推理过程,并实现不同规格卷积操作在可重构阵列处理器上灵活部署。在Virtex—6开发板上的测试结果表明:相比基于现场可编程门阵列(FPGA)实现CNN,本文实验LUTs资源消耗减少70%,FF资源消耗减少50%。时钟频率达到113 MHz,峰值运算速度达到1.8 GOP/s,与领域专用可重构处理器相比,运算性能提升19.7%。
- 朱育琳蒋林王欣刘帅
- 关键词:卷积神经网络数据复用并行化
- 基于可重构阵列的CNN数据量化方法
- 2024年
- 针对卷积神经网络(CNN)模型中大量卷积操作,导致网络规模大幅增加,从而无法部署到嵌入式硬件平台,以及不同粒度数据与底层硬件结构不协调导致计算效率低的问题,基于项目组开发的可重构阵列处理器,面向支持多种位宽的运算单元,通过软硬件协同和可重构计算方法,采用KL(Kullback-Leibler)散度自定义量化阈值和随机取整进行截断处理的方式,寻找参数定长的最佳基点位置,设计支持多种计算粒度并行操作的指令及其卷积映射方案,并以此实现三种不同位宽的动态数据量化。实验结果表明,将权值与特征图分别量化到8 bit可以在准确率损失2%的情况下将模型压缩为原来的50%左右;将测试图像量化到三种位宽下进行硬件测试的加速比分别达到1.012、1.273和1.556,最高可缩短35.7%的执行时间和降低56.2%的访存次数,同时仅带来不足1%的相对误差,说明该方法可以在三种量化位宽下实现高效率的神经网络计算,进而达到硬件加速和模型压缩的目的。
- 朱家扬蒋林李远成宋佳刘帅
- 关键词:卷积神经网络加速比
- 一种基于NOMA的认知网络递增中继传输方法
- 本发明公开了一种基于NOMA的认知网络递增中继传输方法,包括:步骤(1)、第一时隙,源节点S利用NOMA传输方法,根据信道增益把总发送功率分配给待发送信号,再利用所分配的功率,将叠加信号分别发送给目的节点D和N个中继节点...
- 刘帅赵安新张元龙