王长缨
- 作品数:23 被引量:114H指数:6
- 供职机构:国防科学技术大学信息系统与管理学院管理系更多>>
- 发文基金:国家自然科学基金国防科技大学预研基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学社会学更多>>
- 基于目标分解的多Agent协作强化学习方法
- 本文将单agent Q学习引入到多agent环境,提出了一种多agent协作团队的Q学习方法,即基于承诺和约定先给agent分配求解子目标,然后针对系统求解过程中的相似性,用相似性来减少学习过程的状态空间,并利用Q值共享...
- 尹晓虎王长缨姚莉鲍翊平
- 文献传递
- 基于语义Web的CBR结构研究
- CBR是人工智能的传统研究领域,随着Internet规模的急剧扩大,CBR系统需要基于Web框架,案例的存储形式、相应的组织结构,及其检索推理方法都需要满足网络要求。本文基于语义Web技术,提出一种基于语义Web的案例表...
- 刘芳王长缨姚莉张维明
- 关键词:人工智能语义WEB电子商务
- 文献传递
- 一种新的多主体学习方法被引量:3
- 2003年
- 提出了一种在大型复杂的多主体系统中逐步改进个体与群体问题求解能力的学习方法——基于基组织结构的共识学习方法 .通过该方法 ,各主体能够针对某一领域问题交换意见 ,分别扩充或修改各自原有的知识 ,直到达成共识 。
- 王长缨姚莉张维明陈文伟龚勇
- 关键词:分布式人工智能多主体系统
- 基于MAS的协作信息系统试验平台的设计与实现被引量:3
- 2000年
- 试验平台是形式理论和实际应用之间的桥梁,是目前MAS研究的主要手段。该文讨论了设计和实现MAS试验平台的一般问题,重点介绍了在MACIST中从体系结构和单个agent内核基本结构等角度对这些问题提出的解决方案。
- 徐振宁姚莉张维明龚勇王长缨
- 关键词:多主体系统信息系统信息处理
- 基于多智能体的复杂信息系统开发方法研究被引量:23
- 2002年
- 提出一种将组织学与多智能主体技术相结合建造复杂信息系统的开发方法 .该方法的基本思想是首先将复杂信息系统看成一个多主体组织 ,依据组织学原理分析多主体系统组织特性 ,建立多主体组织模型 ,从而形成多主体系统宏观结构和功能需求的严格规范 ;其次 ,根据现有技术和可用资源确定承担各类组织职能的多个主体 ,由此确定了各主体的职责和粒度 ;然后 ,依据组织模型 ,采用信念 -愿望 -意图 ( BDI)结构设计各类主体的概念模型 ,为系统的机上实现建立清晰的可操作的开发模式 ;最后 ,将所设计的概念模型在协同工作平台 ( MBOS)上编程实现 。
- 姚莉张维明王长缨龚勇
- 关键词:信息系统智能主体软件工程
- 关于信息收集主体及协作信息收集(CIG)技术的研究
- 2001年
- 该文主要介绍了基于多主体技术的CIG系统的组织结构框架,描述了CIG技术在主体性能及组织结构上的要求,并从主体的知识表述、通信语言及协议、信息收集过程及主体的学习能力等方面介绍了单个主体的设计。
- 龚勇姚莉张维明王长缨
- 关键词:多主体系统人工智能多主体系统
- 一种共享经验元组的多agent协同强化学习算法被引量:6
- 2005年
- Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高。最后将该算法应用于猎人捕物问题域。实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的。
- 王长缨尹晓虎鲍翊平姚莉
- 关键词:多AGENT学习Q学习
- 多主体系统中的联盟形成技术综述被引量:5
- 2004年
- 本文给出了多主体联盟技术的定义,介绍了联盟形成的行为规范机制、CFG对策及其它的联盟形成模型。最后,给出了该领域的研究展望。
- 龚勇姚莉张维明王长缨
- 关键词:分布式人工智能多主体系统联盟形成
- 基于随机博弈的Agent协同强化学习方法被引量:6
- 2006年
- 本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
- 王长缨尹晓虎鲍翊平姚莉
- 关键词:多AGENT系统
- 一种基于团队马尔可夫博弈的多agent协同强化学习算法被引量:3
- 2004年
- 研究多agent系统的学习行为对于智能系统的适应性是至关重要的.针对一类追求系统得益最大化的协作团队的学习问题,基于马尔可夫博弈的思想,提出了一种新的多agent协同强化学习算法.协作团队中的每个agent通过观察协作相识者的历史行为,依照马尔可夫博弈模型预测其行为策略,采用适合的行为探索策略,进而得出最优的联合行为策略.实验对该算法进行了验证,结果表明该算法是有效的.
- 王长缨陈文伟姚莉
- 关键词:团队博弈模型马尔可夫强化学习算法多AGENT系统