戴志辉
- 作品数:4 被引量:5H指数:1
- 供职机构:中国科学院计算机网络信息中心更多>>
- 发文基金:国家高技术研究发展计划中国科学院知识创新工程青年人才领域前沿项目中国科学院信息化专项项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 在计算环境中汇聚队列信息及作业信息的方法
- 一种在计算环境中汇聚队列信息及作业信息的方法,其中所述计算环境具有三层多叉树状的组织结构,这种组织结构包括一个主节点作为根节点、多个分节点作为中间层节点,和多个高性能计算机作为叶子节点,其中主节点管理整个计算环境,包括所...
- 迟学斌肖海力武虹戴志辉王小宁曹荣强
- 文献传递
- 三层架构超级计算环境容错框架被引量:4
- 2011年
- 为确保建成的中国科学院"十一五"信息化重大专项超级计算环境提供稳定可靠的服务,提出三层架构超级计算环境的容错框架。对计算环境可靠性和计算节点可靠性两大部分,通过作业可靠性、服务可靠性和网格节点可靠性三个主要方面的可靠性研究,提出并实现了三层架构超级计算环境的可靠性解决方案。该框架重点解决了单点故障对环境的影响,确保单点故障发生后系统能够继续提供高可用的高性能计算服务。
- 戴志辉肖海力曹荣强迟学斌曹宗雁
- 关键词:可靠性容错网格作业管理
- 基于任务负载监测的高性能集群节点启停机制被引量:1
- 2011年
- 对高性能计算集群在运行过程中如何通过关闭闲置节点来实现有效节能的问题进行了研究和探讨,设计和实现了基于任务负载量统计监测的节点启停机制。根据对系统中作业运行和排队情况的记录和分析,通过参数估计设计了反映队列任务情况的负载因子,并围绕负载因子制定具体策略,结合作业系统的队列设置和资源分配规则,对集群中的空闲节点进行自动启停控制。模拟实验表明,基于任务负载监测的节点启停机制能够有效地自动启停系统中闲置的节点,从而降低系统功耗,并且对系统中作业的整体完成时间基本不造成影响。
- 曹宗雁曹荣强戴志辉朱鹏迟学斌
- 关键词:高性能计算机集群参数估计
- 在计算环境中汇聚队列信息及作业信息的方法
- 一种在计算环境中汇聚队列信息及作业信息的方法,其中所述计算环境具有三层多叉树状的组织结构,这种组织结构包括一个主节点作为根节点、多个分节点作为中间层节点,和多个高性能计算机作为叶子节点,其中主节点管理整个计算环境,包括所...
- 迟学斌肖海力武虹戴志辉王小宁曹荣强
- 文献传递