您的位置: 专家智库 > >

国家教育部博士点基金(20100121120022)

作品数:2 被引量:0H指数:0
相关作者:刘云龙吉国力更多>>
相关机构:厦门大学更多>>
发文基金:国家教育部博士点基金福建省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇神经网
  • 1篇神经网络
  • 1篇守门员
  • 1篇足球
  • 1篇足球比赛
  • 1篇仿真
  • 1篇复位
  • 1篇比赛
  • 1篇ROBOCU...
  • 1篇ROBOCU...
  • 1篇CMAC神经...
  • 1篇CMAC网络

机构

  • 2篇厦门大学

作者

  • 2篇吉国力
  • 2篇刘云龙

传媒

  • 1篇计算机学报
  • 1篇北京工业大学...

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略
2012年
针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)学习算法获取守门员的最优策略.通过在RoboCup仿真平台上进行仿真,实验结果表明,采用基于CMAC的Sarsa(λ)学习算法的守门员,经过一定时间的学习后,防守时间显著增长,防守效果明显优于其他算法,验证了本文所提方案的有效性.
刘云龙吉国力
关键词:CMAC神经网络
预测状态表示模型的复位算法
2012年
预测状态表示(Predictive State Representations,PSRs)是用于解决局部可观测问题的有效方法.然而,现实环境中,通过样本学习得到的PSR模型不可能完全准确.随着计算步数的增多,利用PSR模型计算得到的预测向量有可能越来越偏离其真实值,进而导致PSR模型的预测精度越来越低.文中提出了一种PSR模型的复位算法.通过使用判别分析方法确定系统所处的PSR状态,文中所提算法可对利用计算获取的预测向量复位,从而提高PSR模型的准确性.实验结果表明,采用复位算法的PSR模型在预测精度上明显优于未采用复位算法的PSR模型,验证了所提算法的有效性.
刘云龙吉国力
关键词:复位
共1页<1>
聚类工具0