徐金秀
- 作品数:50 被引量:52H指数:5
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学天文地球自然科学总论更多>>
- 气体动理论统一算法中的CPU+GPU异构并行优化方法
- 本发明公开了一种气体动理论统一算法中的CPU+GPU异构并行优化方法,包括CPU+GPU异构并行的实现以及优化;优化方法包括:S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;S...
- 李志辉张子彬彭傲平白智勇徐金秀吴俊林蒋新宇
- 基于数据结构的众核程序重构方法
- 本发明公开一种基于数据结构的众核程序重构方法,包括基于提取基本类型数据结构的重构方法、基于数组降维的空间压缩的重构方法、基于增大传输字长的空间压缩的重构方法。本发明主要针对多级异构众核并行计算问题中多样化的数据结构,提供...
- 徐金秀何香陈鑫徐占刘鑫李芳孙唯哲郭恒赵朋朋
- 文献传递
- 基于序列分层的异构众核快速傅里叶变换方法
- 本发明公开一种基于序列分层的异构众核快速傅里叶变换方法,包括以下步骤:S1、将待转序列按FFT运算层序进行分块,分块大小为当前运算层一次基本运算的子序列大小,即第1次分块时,每个分块的大小为2,即将输入序列分成大小为2的...
- 孙唯哲陈鑫陈德训刘鑫李芳徐金秀郭恒赵朋朋
- 大规模异构并行计算的容错方法
- 本发明提供了一种大规模异构并行计算的容错方法,包括:对每个时间步的每个核心计算模块,进行以下处理:将计算课题的计算数组的内容赋值给备份数组;完成核心计算模块的计算;其中,完成核心计算模块的计算包括:统计可用处理器核数,以...
- 陈德训刘鑫李芳徐金秀
- 文献传递
- 一种基于RDMA机制的并行输入输出方法
- 本发明提供了一种基于RDMA机制的并行输入输出方法。所述并行输入输出方法包括:客户端通过套接字端口向服务器发送输入输出操作信息;客户端通过InfiniBand端口向服务器传送输入输出操作数据;服务器根据接收到的输入输出操...
- 房田文徐金秀漆锋滨周明忠陈德训
- 文献传递
- N-S方程并行求解性能研究
- 2004年
- N-S方程在CFD(computational fluid dynamics)领域有着广泛的应用。该文介绍了数值模拟CFD中N-S方程的两种求解方法:块三对角法和标量五对角法。在分析了求解过程的数据内在关系后,提出了用单分区和多分区进行区域分裂并行求解的不同策略,着重考虑了在一个消息传递型系统上求解的最小执行时间,并对数据相关性、通信开销、存储开销等相关性能给出了较详细的分析研究,最后给出了性能测试的部分结果。
- 谭菊仙徐金秀陆鑫达
- 关键词:数据分布
- 面向众核架构的稀疏矩阵向量乘众核优化方法
- 本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x...
- 郭恒陈鑫刘鑫陈德训李芳徐金秀孙唯哲
- 文献传递
- MPI并行调试与优化策略在三维绕流气体运动论数值模拟中的应用被引量:2
- 2012年
- 从求解三维绕流问题的Boltzmann模型方程的数值模拟程序出发,通过研究区域分解并行计算策略,引入输入/输出、通信与CACHE等优化策略,对数值模拟程序进行MPI并行化移植与高性能计算调试。以高空稀薄过渡流区飞行器绕流状态为算例,进行了MPI大规模并行计算测试,证实了所发展的MPI并行化区域分解策略及程序优化途径的正确性。研究表明开展的并行化实现能明显地缩短模式计算时间,并取得较好的效果。
- 徐金秀李志辉尹万旺
- 关键词:BOLTZMANN模型方程并行计算
- 气体动理论统一算法中的CPU+GPU异构并行优化方法
- 本发明公开了一种气体动理论统一算法中的CPU+GPU异构并行优化方法,包括CPU+GPU异构并行的实现以及优化;优化方法包括:S1、基于Boltzmann方程统一算法的并行运行流程和热点代码,对CPU消耗时间进行统计;S...
- 李志辉张子彬彭傲平白智勇徐金秀吴俊林蒋新宇
- 一种安全快速的大规模并行计算输入输出实现方法
- 本发明公开一种安全快速的大规模并行计算输入输出实现方法,该方法建立双备份安全目录机制;采用断点文件的分层目录结构管理;根据底层网络带宽和计算节点主核数选择输出因子。本发明解决了超大规模断点文件的安全性问题,解决了超大规模...
- 陈德训郭恒徐金秀李芳徐占孙唯哲范昊
- 文献传递