国家高技术研究发展计划(2002AA1Z2102)
- 作品数:44 被引量:202H指数:7
- 相关作者:金海孟丹詹剑锋徐婕韩宗芬更多>>
- 相关机构:华中科技大学中国科学院浙江大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 高可用冗余TCP协议堆栈被引量:1
- 2005年
- 提出了一个冗余 TCP堆栈 (RTS)方案以提高 TCP网络连接的可靠性和计算机集群提供服务的可用性 .RTS允许多个服务器同时在一个 TCP连接里工作 ,极大的改善了 TCP连接提供的服务的可信赖性 .在 RTS中还设计了两个算法 (SWMU和 SWFR)来解决在多个 TCP协议堆栈中的同步问题 .实验表明 ,使用 SWFR和 BRC算法可以将网络性能的损耗减到最少 ,并且配备两台服务器的集群所发挥的性能可充分满足在实际使用中所需的高效传送 .
- 邵志远金海徐婕
- 关键词:可靠性可用性集群计算
- 检查点系统中进程地址空间的优化存储策略被引量:1
- 2005年
- 机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大量的作业无法完成。检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分。进程的地址空间是检查点系统需要记录的一部分重要内容,对它的存储效率直接影响检查点操作的性能。论文提出了两种检查点系统中进程地址空间的优化存储策略。其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,A-O(Access-Order)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升。在实验中,A-O进程地址空间存储策略最高可以将传统的存储策略的时间开销缩减至原来的50%。
- 李艳红孟丹周应超武林平
- 关键词:机群系统检查点系统存储策略
- 集群动态负载平衡系统的性能评价被引量:48
- 2004年
- 该文使用随机Petri网对集群动态负载平衡系统建立了一个抽象模型 .通过细化模型中的节点本地处理部分对 5种动态负载平衡算法的性能进行了分析 ,并讨论了集群负载特性对动态负载平衡系统性能的影响 .最后得出的主要结论有 :(1)动态负载平衡算法可以取得比静态负载平衡算法更好的性能 ;(2 )与传统的只考虑CPU就绪队列的负载平衡算法相比 ,考虑了各种I/O请求队列的负载平衡算法可以取得更好的性能 ;(3)即使在极端的集群负载特性中 ,集群动态负载平衡算法仍然能取得比较理想的性能 ,因此实现即使是十分简单的集群动态负载平衡系统也是很有必要的 .
- 唐丹金海张永坤
- 关键词:集群系统性能评价随机PETRI网负载平衡网络
- 基于相互独立检查点的MPI消息日志系统被引量:1
- 2004年
- 提出了一种新的MPI消息日志机制及实现原理 ,它基于发送方的混合日志协议 ,采用收消息和发消息的全监管机制 ,使每个进程的消息收、发过程与检查点操作时机相对独立 .当一支进程失效时 ,只回滚该进程本身 ,减小了因为单支进程失效给整个执行过程带来的进度影响 ,也使得并行程序具有类似于独立运行程序的自由度 .
- 庞丽萍陈宝利
- 关键词:MPI并行计算消息日志检查点容错
- 一种面向应用程序的作业资源管理系统ARMS被引量:1
- 2004年
- 本文在综合分析了现有作业资源管理系统的基础上,提出了一种新的面向应用程序的作业资源管理系统模型ARMS。该模型引入了资源预测分析和面向应用程序的调度,提高了系统的资源利用率。
- 李胜利赵美平陈刚
- 关键词:应用程序ARMS集群系统
- 高可用机群系统辅助测试工具:HABench被引量:2
- 2005年
- 双机高可用系统是当前高可用机群系统的重要应用模式之一。为了保证高可用性,必须对其进行全面、完备的测试。传统的高可用系统的测试以手工测试为主,需要大量的人工参与,测试的过程不够规范。文章提出了一种高可用机群系统的测试软件HABench,该软件可以减少测试人员的手工参与,规范测试的过程,并且保证测试的完备性。该文介绍了该测试软件的功能、结构和技术特点,以及实现此软件所需要的几个关键技术。
- 王磊詹剑锋孟丹
- 关键词:测试软件
- 基于集群的轻量可扩展TCP容错方法
- 2006年
- 针对现有TCP容错方案在高可用性方面的不足,提出了一个新的容错方案———轻量拷贝的传输控制协议ER-TCP.该方案采用日志管理配合主动复制的方法,可降低通信转发结点的负载;采用高效的同步算法可以减轻多个备份服务器的同步对通信造成的性能损失.与其他TCP容错方案进行性能测试的结果比较表明,ER-TCP对通信造成的性能损失小,在多个备份服务器的情况下ER-TCP仍可保持较高的通信效率.
- 邵志远金海
- 关键词:集群计算高可用性
- VoD系统中基于优先级的准入控制和带宽分配策略被引量:3
- 2005年
- 本文针对VoD系统中不同客户对视频服务质量的不同要求,提出一种基于优先级的准入控制和带宽动态分配策略。在准入控制时,综合考虑请求的优先级和并发流占用的实际带宽等因素,在保证为高优先级请求预留较多固定带宽的同时提高并发流个数;在服务过程中,根据优先级和网络状况动态调整每个流的带宽,使丢包率低于一定的阈值,并保证在相同的网络状态下为高优先级请求提供较高的视频服务质量。
- 韩宗芬吴敏娜董志金海
- 关键词:视频点播系统准入控制VOD系统
- 一种集群文件系统元数据管理技术被引量:1
- 2006年
- 本文研究集群文件系统的特征,提出了一种分布式元数据管理技术。该技术通过哈希方式分布元数据对象、自侦测自适应和连续相邻节点备份的方法,实现了元数据的动态扩展和高可用。在我们研制的HANDY文件系统中采用了这项技术。测试结果说明,HANDY的元数据扩展性是令人满意的,实现了动态可扩展和高可用的设计目标。
- 李胜利陈谦程斌唐维
- 关键词:元数据并行文件系统高可用
- SS-RTUDP:轻量级实时网络通信协议在集群系统中的实现被引量:1
- 2006年
- 轻量级实时网络通信协议对于科学计算集群与视频服务集群至关重要.SS-RTUDP以UDP协议为基础,通过以下途径在集群系统得到实现:静态分配网络资源、用户空间到内核空间的数据零拷贝操作、添加实时平滑层以及使用伪中断技术消除网卡硬件中断开销.性能测试结果表明该协议不仅具有较UDP更小的通信延迟与更高的通信带宽,同时较大程度提高了集群系统的实时通信性能.
- 张明虎金海谭朋柳陈汉华李胜利
- 关键词:集群系统实时网络通信