李长江
- 作品数:5 被引量:15H指数:2
- 供职机构:西北工业大学计算机学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于人工神经网络的并行强化学习自适应路径规划被引量:8
- 2011年
- 强化学习是通过对环境的反复试探建立起从环境状态到行为动作的映射。利用人工神经网络的反馈进行权值的调整,再与高学习效率的并行强化学习算法相结合,提出了基于人工神经网络的并行强化学习的应用方法,并通过实验仿真验证了迭代过程的收敛性和该方法的可行性,从而有效地完成了路径学习。
- 耿晓龙李长江
- 关键词:BP神经网络路径规划Q学习
- 基于HLA的战术任务仿真系统研究被引量:2
- 2011年
- 高技术条件下的武器试验、人员训练等对战术任务仿真提出了更高的要求,针对现有战场仿真系统在通用性、开放性、安全性等方面的不足,采用Ice中间件搭建起符合HLA规范的RTI支撑环境,在此基础上,构造出一种通用的、跨平台的战术任务仿真系统框架。该框架实现了战术任务仿真所需要的战斗实体生成、战场态势显示、想定编辑等功能,具有跨平台、开放性、便于二次开发的优点,且具有良好的安全性和经济性。
- 尹胜刚翟正军李长江
- 关键词:高层体系结构运行支撑框架战场仿真
- 基于隐马尔可夫模型的机器人足球赛场态势评估被引量:4
- 2012年
- 针对机器人足球赛场态势评估问题,提出一种基于隐马尔可夫模型(HMM)的机器人足球赛场态势评估模型。通过对赛场信息进行提取和量化,抽象出7个相关态势因素,作为HMM模型的输入数据。通过采用改进的Bauw-Welch算法优化HMM的参数,从而获得赛场态势评估结果。实验结果表明,所提出的方法能较好地满足赛场实时性和准确性的要求,可以为球场上对应策略的变更提供及时、可靠的依据。
- 李长江李孝安
- 关键词:机器人足球隐马尔可夫模型
- 基于人工免疫机理的赛场态势评估模型
- 2011年
- 伴随着足球机器人比赛水平的不断提高,对足球机器人赛场的态势做出实时、客观、准确的评估已经成为足球机器人态势评估系统亟待解决的重要问题。在已有相关的研究基础上,运用人工免疫机理对足球机器人赛场态势进行评估建模和研究,提出算法。仿真实验表明,基于人工免疫机理所建立的赛场态势评估模型与传统的态势评估模型相比较,具有实时、定量、自适应等特点;模型能够实时,量化评估赛场上的态势变化,从而为及时地提出对应的策略提供了准确而强有力的依据。
- 车鸣李孝安李长江
- 关键词:机器人足球人工免疫
- 基于强化学习的全自主机器人足球系统协作研究被引量:1
- 2011年
- 从人工智能的角度上说,机器人足球比赛主要研究了多智能体系统要解决的分布的多机器人在复杂的动态环境下,如何通过相互协商完成某一复杂任务。全自主机器人足球是机器人足球发展的一个趋势,在完全未知的环境中,通过自身学习来了解和积累外部信息。对于传统强化学习,存在容易出现死锁,学习速度慢,要求外部条件是静态等缺陷。提出了一种基于蚁群算法的强化学习模型,即蚁群算法与Q学习相结合的思想。随着赛场上态势的渐趋复杂,传统的Q学习速度会变得很慢且交互困难。通过对新算法的分析,实验数据显示:新算法不仅提高了Q学习的学习速率,在解决状态空间维数的灾难问题上,也是可行的。
- 王腾李长江
- 关键词:Q学习蚁群算法