李文明
- 作品数:93 被引量:35H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金中国科学院战略性先导科技专项国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 一种ECDSA算法执行系统及方法
- 本发明提供一种ECDSA算法执行系统及方法,主机端通过数据流芯片进行加密和解密操作,通过网络传输加密信息。本发明相比于现有技术,通过将ECDSA算法移植到数据流架构芯片上,利用了数据流架构芯片低访存需求的特点,加快了EC...
- 范志华秦宏吴欣欣李文明安学军叶笑春范东睿
- 文献传递
- NDP-Ledger:面向区块链应用的通用高通量加速架构
- 2020年
- 区块链技术由于去中心化及不可篡改等特性,广泛应用于数字货币、支付交易等领域,其算法对计算能力和存储访问能力有较高要求,导致传统冯诺依曼结构在面向区块链应用时能效比较低。3D堆叠存储器因可以缓解冯诺依曼结构的访存瓶颈,成为了热门研究方向之一。本文基于3D堆叠存储器技术及数据流执行模式,提出了一种面向区块链应用的高通量近数据处理(NDP)架构,NDP-Ledger。本文深入分析和论证了区块链应用的计算特征及3D堆叠存储技术在区块链应用中的适应性问题,并基于数据流执行模式设计了一种通用的高并发区块链加速体系结构,使区块链加速器在满足通用性的前提下提高处理性能。模拟评估结果表明,本文提出的区块链通用加速器结构,在典型区块链应用处理方面的性能优于主流的CPU和GPU。
- 安述倩李文明李文明范志华吴萌王达张浩王达
- 关键词:区块链数据流
- 一种异常事件自动推送及基于历史操作的监控方法及系统
- 本发明提出一种异常事件自动推送及基于历史操作的监控方法及系统,涉及监控室内视频墙智能显示领域,该方法包括获取多路视频流,对所述多路视频流进行编解码操作,生成与每路所述视频流相对应的图像帧,通过识别算法对所述图像帧进行异常...
- 李文明叶笑春孙凝晖范东睿王达马丽娜朱亚涛张洋
- 文献传递
- 面向数据流结构的指令内访存冲突优化研究被引量:1
- 2019年
- 神经网络等人工智能应用的迅速兴起给传统处理器的设计带来了巨大的挑战,粗粒度数据流架构因具有高指令并发和高通用性的特点成为研究热点.然而,由于粗粒度数据流结构处理单元采用随机访问存储器作为存储结构,加之神经网络中大部分运算数据具有密集型特点,造成大量的指令内操作数访存冲突.通过分析典型神经网络的访存行为,发现此类应用存在指令内操作数冲突,会引起计算部件利用率的降低.基于此分析,提出了灵活的数据冗余策略.在编译指令阶段,为指令内有访存冲突的操作数申请数据冗余空间,降低指令内操作数访存延迟.实验以典型的神经网络LeNet,AlexNet为基准测试程序.采用灵活的数据冗余策略之后,能耗比相对于Round-Robin和ReHash的无数据冗余策略分别提高了30.21%和12.37%,相比于2套全数据冗余策略能耗比提高了27.95%.
- 欧焱冯煜晶李文明叶笑春王达范东睿
- 关键词:数据冗余能耗比
- 一种哈希硬件处理装置及方法
- 本发明提供一种基于阻变存储器的哈希硬件处理装置及方法,所有的源数据无需送往CPU进行哈希函数的计算,在RRAM中根据电流叠加效应即可完成哈希函数输入数据的操作,并在存储器中实现哈希表的建立,无需将大量的源数据送往CPU后...
- 李文明叶笑春安述倩姜志颖王晨晖范东睿
- 高密度片上网络的路网实现方法及装置
- 本发明提供了一种高密度片上网络的路网实现方法,适用于众核片上网络技术领域,包括:步骤1,将第一路由和第二路由的链路划分为多个低宽度的自治的子链路;步骤2,检测输入端口的数据包的队列,配置所述子链路和所述队列在同一时刻并行...
- 李文明孙凝晖谢向辉李宏亮郑方
- 文献传递
- Flex-DMA:支持多模式高效传输的DMA系统设计
- 2024年
- 随着数据密集型科学和高通量应用的迅速发展,专用集成电路设计不断涌现,传输系统不再只有数据传输的需求。现有的一些直接存储器访问(Data Memory Access,DMA)设计可以支持高效的矩阵转置传输,但这些设计不能满足复杂的访存模式,也不具有灵活的可配置性,从而降低计算效率。针对这些问题设计了一种可配置的多模式传输系统Flex-DMA,该系统包含可配置的寄存器以及传输通道,拥有基础模式和单指令多数据(Single Instruction Multiple Data,SIMD)模式。因此,Flex-DMA可根据不同的数据传输需求选择不同的传输模式,灵活配置数据规模和数据格式,支持数据向量化转换、矩阵转置传输等功能。在大规模并行模拟框架中对Flex-DMA做性能评估,其结果表明,Flex-DMA在数据向量化处理中可以获得平均5.14倍的加速比。此外,与MT-DMA结构相比,Flex-DMA在矩阵转置传输中可以获得平均2.52倍性能提升。实验证明:Flex-DMA能满足复杂的访存模式和传输需求,在低传输时延下实现数据的重组和预处理。
- 李德建冯曦王国旋谭浪沈冲飞范志华李文明
- 关键词:直接存储器访问
- 高通量众核数据流处理器及其任务执行方法
- 本发明提出一种高通量众核数据流处理器,包括:多个处理单元,相互通信连接形成该处理器的片上网络结构;每个该处理单元包括多个子处理单元,该子处理单元包括指令子存储器和数据子存储器,多个该子处理单元以阵列结构排列,且相互通信连...
- 李文明安述倩吴海彬刘艳欢吴萌叶笑春范东睿
- 文献传递
- 基于数据流架构的快速傅里叶变换方法、系统和存储介质
- 本发明涉及一种基于数据流架构的快速傅里叶变换方法、系统和存储介质,包括:从X个源操作数中按照码位倒置顺序载入2(log<Sub>2</Sub>X‑log<Sub>2</Sub>Y)个源操作数和旋转因子,Y为处理单元数,以...
- 邹沫张鲁培李文明叶笑春范东睿
- 文献传递
- 一种用于探索CPU微架构的设计空间的方法和装置
- 本发明提供了一种用于探索CPU微架构的设计空间的方法和装置,该方法包括:获取所有设计点和负载;利用运行负载的模拟器对部分设计点进行模拟输出对应的性能指标,并构建训练集训练性能预测模型;利用经训练的性能预测模型预测剩余设计...
- 王铎严明玉刘昕李文明黄俊英叶笑春范东睿