国家高技术研究发展计划(2006AA01A103) 作品数:13 被引量:49 H指数:4 相关作者: 杨孝宗 吴智博 刘宏伟 董剑 左德承 更多>> 相关机构: 哈尔滨工业大学 东北林业大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国际科技合作与交流专项项目 更多>> 相关领域: 自动化与计算机技术 自然科学总论 电子电信 理学 更多>>
一种新型NoC拓扑结构的研究 被引量:4 2008年 提出一种片上网络(NoC)拓扑结构——Spidernet,并对其网络的主要属性如节点度、网络直径、连通度、平均最短路径和平均最短布线等进行了研究。首先将 Spidernet 与其它拓扑结构的属性进行比较,并采用模拟退火的布局映射算法,根据NoC的布局结构,将不同的节点放入 NoC 网格中,即给出一组被绑定和调度的可供选择 IP 核,在满足 IP 核所占用芯片面积的条件下将选择的 IP 核映射到网络中,目标是最小化平均布线长度。网络拓扑结构图描述文件和 IP 核任务图作为输入。实验中运行基准程序,结果表明提出的网络拓扑结构更适合于将来的 SoC 的片上网络构造。 温东新 朴守业 王玲 杨孝宗 吴智博关键词:SOC NOC 拓扑结构 面向事务处理的容错计算机系统结构设计与实现 被引量:5 2008年 提出了一种面向事务处理的容错计算机体系结构,设计了基于三模冗余的仲裁器和仲裁算法。在集群中,利用中心结点故障检测机制,采用仲裁器得到了一个逻辑上高可靠的管理态结点,通过该结点可以实现系统快速故障诊断和故障.恢复。实验结果表明:节点间故障检测时间小于2s,故障节点切换时间小于5s,该系统的故障检测、故障节点切换可以满足事务处理系统对可靠性的要求。 左德承 张展 董剑 刘宏伟 杨孝宗关键词:容错 故障检测 故障诊断 一种基于马尔可夫链的容错系统可靠性评估方法 计算机可靠性是衡量计算机系统性能的一项重要指标,评估计算机系统的可靠性在系统的设计和实践阶段有着十分重要的意义。针对较为常见的双机冗余容错系统,本文给出了一种基于马尔可夫链模型的评估容错系统可靠性的方法。该方法通过故障注... 刘璧怡 吴智博 景维鹏关键词:容错系统 可靠性评估 马尔可夫链模型 文献传递 基于机制设计理论的自组网节点合作协议 被引量:8 2009年 在移动自组网中,如何激励自私节点,使之参与网络合作,是当前研究的热点问题.文中提出了LMOCP协议,采用VCG机制计算转发节点的支付.通过引入邻居发现机制,并改进路由发现过程,使网络中控制消息的数量从O(n3)减少到O(n2).对协议的正确性进行了分析,并证明了LMOCP协议是事后纳什可实施的,在所有节点都是理性的这一共同知识的假定下,每个节点的最优策略是诚实地报告自己的转发价格.通过ns-2对协议进行了验证,仿真结果显示,与现有的几种重要协议相比,LMOCP协议具有更低的消息负载和网络延迟. 郭建立 吴智博 董剑 杨孝宗 刘宏伟关键词:移动自组网 自私节点 邻居发现 求解复杂优化问题的双层多种群粒子群优化算法 被引量:1 2009年 为解决粒子群优化算法存在的易早熟和精度低问题,提出了一种双层多种群粒子群优化算法。此算法采用上下两层,即下层N个基础种群和上层一个精英种群。各个基础种群相互独立进化,并从精英种群中得到优良信息指导自己的进化。上层精英种群首先通过接受各基础种群的当前最优粒子来更新自己的粒子集合,然后执行自适应变异操作,最后随机地向每一个基础种群输送出本次进化后的一个最优粒子来改进其下一轮搜索。该算法的并行双进化机制增加了群体的随机性和多样性,提高了全局搜索能力和收敛精度。实例仿真表明该算法具有较好的性能,尤其对于复杂多峰函数优化,成功率显著提高。 高芳 崔刚 吴智博 刘宏伟 杨孝宗关键词:自适应变异 一种基于移动计算环境的因果日志卷回恢复算法 被引量:10 2008年 由于移动节点的不可靠和无线网络连接的脆弱性,研究移动计算系统容错机制具有重要意义.对可以跨区移动、随时可以与网络断开的自治性很强的移动节点来说,异步的卷回恢复是一种重要的容错手段.现有的移动计算环境下的卷回恢复算法都无法完全实现一致的异步卷回恢复.基于因果消息日志,提出一种新的移动计算环境的卷回恢复算法:通过先行图来记录节点间的消息依赖关系,将异步检查点、基于发送方的暂存消息日志和先行图全部在移动支持站上存储和处理,为移动节点提供一种透明的容错服务,完全消除依赖关系在移动节点之间造成的影响.用形式化的方法证明了系统的一致性.仿真结果表明,在卷回开销达到最低的同时,也显著降低了无错运行时的通信和存储开销. 张展 左德承 慈轶为 杨孝宗可靠性代价和Makespan驱动的分布式容错调度算法 2012年 为解决异构分布式环境下采用主副版本策略的可靠性调度问题,提出一种基于优先级约束的可靠性代价和Makespan(调度时长)驱动的分布式容错调度算法DRCAMD。该算法可在满足系统可调度性的前提下,以异构分布式环境的节点、通信链路的可靠性与Makespan做为可调节局部目标函数,实现具有较高可靠性及较短执行时间的容错调度策略,避免将任务分配到失效率较高的节点上执行。另外,算法的副版本采用被动和主副重叠方式执行,使得容错调度算法具有较大的灵活性。仿真实验表明,该算法性能优于现有容错算法。 景维鹏 吴智博 刘宏伟 董剑基于自主计算的集群故障管理系统结构 2011年 随着计算机技术的不断发展和系统规模的不断扩大,高可用集群系统的管理和维护变得越来越复杂。为了提供稳定的计算环境,并及时发现定位系统中的故障隐患,提出了故障的主动管理方法。该文首先分析了自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,提出了一种基于规则的自主故障管理软件结构。根据集群系统的特点,选择分级管理方式,设计了局部故障管理模块(LFM)和全局故障管理模块(GFM),并具体说明了二者内部的功能结构。 李璟 刘宏伟 董剑 舒燕君基于Markov链的容错系统可靠性评估 被引量:1 2011年 计算机可靠性是衡量计算机系统性能的一项重要指标,评估计算机系统的可靠性在系统的设计和实践阶段有着十分重要的意义。针对较为常见的双机冗余容错系统,该文给出了一种基于Markov模型的评估容错系统可靠性的方法,该方法通过故障注入来加速系统失效、模拟容错系统运行时的事件、对系统运行状态进行划分,使用Markov链对系统状态进行建模来评估容错系统的可靠性。实验测试结果表明:该方法能有效地对容错系统可靠性进行评估。 刘璧怡 吴智博 景维鹏关键词:容错系统 可靠性评估 MARKOV链模型 支持优先级约束任务的容错调度算法 被引量:4 2011年 为了解决异构分布式系统中可靠调度问题,提出一种考虑处理机链路通信竞争的,支持优先级约束任务的容错调度(FSPCT)算法。该算法使用通信竞争模型描述处理机之间通信,在备份成本最小化和备份任务最早完成之间寻求平衡点。对主副版本任务的最早开始时间进行分析,并限定了所执行的处理机,在处理机出现故障后任务可以顺利执行。实验结果表明FSPCT算法的综合性能优于现有一些算法。 景维鹏 吴智博 刘宏伟 董剑关键词:异构 容错 通信竞争