国家高技术研究发展计划(2012AA01A309) 作品数:30 被引量:84 H指数:6 相关作者: 莫则尧 崔涛 冷伟 曹立强 武林平 更多>> 相关机构: 北京应用物理与计算数学研究所 中国科学院 深圳大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 理学 电子电信 更多>>
并行自适应有限元计算中的负载平衡研究 被引量:2 2015年 偏微分方程的并行求解,关键问题之一是网格划分,它不仅要求每个进程拥有相等的计算负载,同时要求有良好的划分质量,以减少进程间通信.在自适应有限元计算过程中,网格/基函数不断调整,会导致负载不平衡,必须动态地调整网格分布,从而实现动态负载平衡.本文研究了不同的负载平衡方法,并在并行自适应有限元平台PHG中实现.数值实验表明我们的动态负载平衡算法具有很高的划分质量,运行速度快,可有效划分网格并减少运行时间. 刘辉 冷伟 崔涛关键词:自适应有限元 并行计算 动态负载平衡 空间填充曲线 科学计算双路并行I/O优化方法 被引量:1 2015年 科学计算数据集由数据和元数据组成.一般条件下,数据的尺寸较大,元数据尺寸较小.传统的高性能计算机并行文件系统可以高效率地读写大块连续数据,但是无法高效率地读写大量较小块的元数据.一旦大块数据和小块元数据两类读写特征混杂在一起,元数据将较严重地干扰并行I/O,造成性能的下降.为此,文中提出数据与元数据分治的双路并行I/O方法.该方法在高层I/O库中建立内存文件系统与并行文件系统两级存储,在存储资源之间并行迁移科学计算元数据.一方面降低较频繁读写元数据的I/O延迟,另一方面改变科学计算数据的存储特征与存储模式,从而提高科学计算应用、尤其是数据分析与可视化等读入密集型应用的I/O效率.测试表明,双路并行I/O方法可提高写性能8%~13%,提高读性能89%到1.01倍. 曹立强 莫则尧 沈卫超 夏芳 陈军关键词:并行I/O 数据格式 复杂物理过程数值模拟的快速定位异常问题的微内核方法 针对复杂物理过程的数值模拟过程中出现的各种异常问题,根据'关注点分离'的原则并借鉴'微内核'的思想,提出一种快速定位异常问题的微内核方法。基于科学计算框架JCOGIN,给出微内核方法在耦合动态随机场数的值模拟中的具体应用... 左风丽; 肖刚; 佘若谷; 张宝印;关键词:关注点分离 文献传递 电表图像中多条码的定位与识别 被引量:1 2014年 根据条形码的平行、密集等特性,设计了一套在电表图像中对多条条形码进行定位并且逐一识别的算法,可用于抄录条码的人工智能设备.该算法主要分三部分,分别是条码定位、条码抽取和条码识别.其中条码定位和条码抽取的算法,是根据条形码的平行和紧密的形态特性而设计;而条码识别在条码抽取的基础上利用组合计算条和空的宽度比例.实验表明,本文算法能够对图像中多个条形码进行准确且快速的定位,并且能逐个识别和校验. 雷海军 林毅锋 罗小江 沈伟鹏关键词:边缘检测 霍夫变换 条码识别 基于谱分割的稀疏矩阵特征值问题并行求解 被引量:4 2015年 本文给出了一个基于谱分割并行求解稀疏矩阵特征值的方案,将矩阵的特征值求解区间划分为多个独立的子区间,分别对各个子区间内的特征值进行独立的并行求解.在该方案中,提出了一种通过盖尔圆信息估计矩阵特征值分布的方法,并结合二分法以及插值方法修正特征值的分布,提高估计的准确性,进行谱区间分割.本文还结合谱分割和基于围道积分的近似谱投影算法设计出一个特征值问题多级并行算法,并在"深腾7000"和"元"超级计算机上验证了本文提出谱分割方案的有效性、均衡性以及特征值并行求解的高效性.同通用求解方法相比,基于谱区间分割的并行算法在1024核上性能提高了5倍以上,并行求解的可扩展性显著提升. 曾玮 赵永华关键词:特征值 面向结构网格自适应并行计算的矩形区域求差集快速算法 被引量:1 2017年 结构网格自适应程序需要使用矩形区域求差集算法计算网格层间数据依赖关系和网格层嵌套关系.原有的矩形区域求差集算法时间复杂度较高,成为该类应用大规模并行计算可扩展性能瓶颈.本文利用分而治之的方法,构造近似线性时间复杂度的矩形区域求差集快速算法,并利用区域分解实现该算法的并行计算.分别针对规则矩形区域和多层自适应网格的非规则矩形区域求差集问题,验证该算法的效率.结果表明,该算法具有近似线性计算复杂度,对于大规模计算问题,加速效果显著. 刘旭 徐小文 张爱清关键词:并行计算 基于内存缓存的异步检查点容错技术 被引量:8 2014年 高性能计算机系统规模越来越大,系统可靠性问题越来越严重.检查点技术是最典型的容错方法,但是因为并行文件系统的性能提高相对缓慢,数据写带宽低,传统检查点方法产生了严峻的性能问题.针对当前计算机系统计算和存储资源丰富,而并行文件系统写带宽提高相对滞后的特点,提出了基于内存缓存的异步检查点容错技术,传统的检查点技术被划分为两步:检查点文件首先被缓存在计算结点的局部内存,然后使用一个独立的帮助任务将数据拷贝到并行文件系统.利用局部内存带宽高以及帮助任务和计算任务并行执行的特点,新方法极大减小了检查点容错引入的时间开销,模拟和实际程序测试验证了异步检查点容错技术的有效性. 易会战 王锋 左克 杨灿群 杜云飞 马亚青关键词:内存缓存 异步 检查点 容错 科学计算应用程序单核指令级优化研究 被引量:4 2014年 尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照高性能计算机体系结构的特点进行针对性的优化,其中单核指令级优化是科学计算应用程序性能优化的重要方面之一.以基于JASMIN(J adaptive structured meshes applications infrastructure)框架实现的Euler程序为例,探讨了科学计算应用程序在Intel Xeon微处理器平台上的具体性能问题和指令级并行性能优化方法,并较大幅度地优化了Euler程序的单核性能.程序优化后,二维和三维两个物理模型计算的总运行时间比优化前减少了21%~34%,核心模块Gas1dapproxy的执行时间缩短了50%以上.性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进. 罗红兵 张晓霞 王伟 武林平关键词:性能分析 XEON 科学计算程序 高维Hilbert曲线的编码与解码算法设计 被引量:9 2015年 本文设计了任意维空间中具有线性复杂度的希尔伯特序编码解码算法并提出了希尔伯特空间填充曲线的一种变体.本文同时对编码解码算法进行了改进,设计了复杂度更低的算法,降低了计算量.文中给出的希尔伯特空间填充曲线的变体保证曲线的编码顺序不随曲线阶数的改变而变化. 刘辉 冷伟 崔涛关键词:HILBERT曲线 高维 解码 一种优化的多视点视频编码预测结构 2015年 首先分析了JMVC的参考预测结构,利用1个Go P(Group of Picture)中不同时间层上的帧与其参考帧之间的相关度不同和不同时间层上的帧数目也不同的特点,提出了去除奇数视点最高和次高时间层的视点间预测,并增加偶数视点非关键帧的最低和次低时间层的视点间预测的预测结构。实验结果表明,提出的预测结构基本不影响视频质量,且表现出了更加出色的编码效率,编码的复杂度减少幅度高达15%,输出码率也有所减少,较好地改善了编码的实时性能。 袁梅冷 杨张 雷海军关键词:多视点视频编码 编码复杂度