冯煜晶
- 作品数:21 被引量:14H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 指令处理方法及装置
- 本发明实施例提供一种指令处理方法及装置。本发明提供的指令处理方法,包括:填写指令队列,写入所述指令队列的为循环指令流,所述循环指令流为程序指令流中的循环体;将所述指令队列中的循环指令流按照循环顺序发送给终端设备,以使终端...
- 侯锐冯煜晶郭旭斌常轶松
- 文献传递
- 一种数据传输装置及传输方法
- 本发明提供一种数据传输装置,包括:控制逻辑,其用于根据配置信息产生相应的控制信号以控制其他模块的动作;其中,存储体接口逻辑用于从存储体中读取数据或向存储体写入数据;第一选择逻辑用于选择与正向传输模式对应的数据传输路径或与...
- 刘艳欢李文明安述倩吴海彬冯煜晶吴萌叶笑春范东睿
- 文献传递
- 将长位宽操作数指令转换为短位宽操作数指令的方法
- 提供了一种用于将原始的长位宽操作数指令转换为短位宽操作数指令的方法,其中,所述长位宽操作数指令包括用于指定至少两个寄存器的至少两个字段,所述至少两个寄存器中的每一个能够存储一个长位宽源操作数,所述方法包括:从所述至少两个...
- 冯煜晶张军张立新侯锐
- 文献传递
- 指令处理方法及装置
- 本发明实施例提供一种指令处理方法及装置。本发明提供的指令处理方法,包括:填写指令队列,写入所述指令队列的为循环指令流,所述循环指令流为程序指令流中的循环体;将所述指令队列中的循环指令流按照循环顺序发送给终端设备,以使终端...
- 侯锐冯煜晶郭旭斌常轶松
- 面向数据流结构的指令内访存冲突优化研究被引量:1
- 2019年
- 神经网络等人工智能应用的迅速兴起给传统处理器的设计带来了巨大的挑战,粗粒度数据流架构因具有高指令并发和高通用性的特点成为研究热点.然而,由于粗粒度数据流结构处理单元采用随机访问存储器作为存储结构,加之神经网络中大部分运算数据具有密集型特点,造成大量的指令内操作数访存冲突.通过分析典型神经网络的访存行为,发现此类应用存在指令内操作数冲突,会引起计算部件利用率的降低.基于此分析,提出了灵活的数据冗余策略.在编译指令阶段,为指令内有访存冲突的操作数申请数据冗余空间,降低指令内操作数访存延迟.实验以典型的神经网络LeNet,AlexNet为基准测试程序.采用灵活的数据冗余策略之后,能耗比相对于Round-Robin和ReHash的无数据冗余策略分别提高了30.21%和12.37%,相比于2套全数据冗余策略能耗比提高了27.95%.
- 欧焱冯煜晶李文明叶笑春王达范东睿
- 关键词:数据冗余能耗比
- 分支目标地址获取方法和装置
- 本发明实施例提供一种分支目标地址获取方法和装置,通过根据当前分支指令的程序计数PC值的中位确定第一分支目标地址缓存BTAC中与当前分支指令对应的第一条目;判断当前分支指令的进程号和当前分支指令的程序计数PC值的高位是否与...
- 侯锐冯煜晶郭旭斌王曦爽
- 文献传递
- 一种用于处理器的扩展浮点运算指令执行方法及装置
- 本发明提供一种用于处理器的扩展浮点运算指令执行方法,包括下列步骤:1)取出扩展浮点运算指令,该指令中至少包括定点运算的操作数存放寄存器字段和定点运算结果存放位置字段;2)对扩展浮点运算进行译码,分解成对应于一系列微操作的...
- 张军张立新冯煜晶侯锐
- 文献传递
- 用于处理器的适于短操作数的扩展指令执行方法及装置
- 本发明提供一种用于处理器的适于短操作数的扩展指令执行方法,包括:1)取出扩展指令,其由处理器的原始长操作数指令扩展而得;原始长操作数指令包括至少两个用于指定操作数位置的域,操作数包括源操作数和目的操作数;其中,将原始长操...
- 张军张立新冯煜晶侯锐
- 文献传递
- 一种分支预测方法及相关装置
- 本发明实施例公开了一种分支预测方法及相关装置,应用于处理器中,上述处理器包括:存储寄存器标识与预测目标跳转地址的一一对应关系信息的第一BTAC,和存储程序计数器的字段与预测目标跳转地址的一一对应关系信息的第二BTAC,其...
- 侯锐冯煜晶郭旭斌张乾龙
- 一种数据报文发送方法、设备及系统
- 本发明实施例提供一种数据报文发送方法、设备及系统。该方法包括:当前节点存在待发送的数据报文时,判断下游节点的当前缓存剩余空间是否大于等于所述数据报文的长度;若是,所述当前节点将所述数据报文发送至所述下游节点;若否,所述当...
- 冯煜晶侯锐张立新郭旭斌
- 文献传递