尤树华
- 作品数:5 被引量:13H指数:3
- 供职机构:苏州大学更多>>
- 发文基金:江苏省高校自然科学研究项目江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于神经网络的强化学习研究概述被引量:4
- 2012年
- 随着强化学习的日益发展,研究越来越深入,将神经网络引入强化学习的研究中已经成为热点课题之一。本文首先介绍强化学习的定义、原理及一般结构,接着简单表述神经网络的基本内容和马尔科夫决策过程模型;然后将强化学习和神经网络融合,重点介绍了两种常见的学习算法,算法都是改进过并且融合了神经网络的特性;最后,简单介绍该方式的强化学习在人工智能,控制系统,游戏以及优化调度等领域的应用情况。
- 尤树华周谊成王辉
- 关键词:神经网络
- 基于三维加速度的连续手势识别被引量:5
- 2012年
- 由于基于图像处理的手势识别方法对环境背景要求较高且存在不稳定性问题,文章使用三维加速度传感器的连续数据进行手势识别。三维加速度传感器内置于大部分智能手机中,具有应用方便的特点。实验通过传感器获取加速度信号,经过低通滤波、去重力和特征提取的信号预处理过程后,结合隐马尔可夫模型和混合高斯模型的理论方法,实现手机手势的连续识别,并驱动应用层预先定义的交互命令。
- 周谊成尤树华王辉
- 关键词:手势识别三维加速度传感器智能手机隐马尔可夫模型混合高斯模型
- 基于三维加速度的连续手势识别
- 由于基于图像处理的手势识别方法对环境背景要求较高且存在不稳定性问题,文章使用三维加速度传感器的连续数据进行手势识别。三维加速度传感器内置于大部分智能手机中,具有应用方便的特点。实验通过传感器获取加速度信号,经过低通滤波、...
- 周谊成尤树华王辉
- 关键词:手势识别三维加速度传感器智能手机隐马尔可夫模型混合高斯模型
- 贝叶斯强化学习中策略迭代算法研究
- 贝叶斯强化学习是基于贝叶斯技术,利用概率分布对值函数、策略和环境模型等参数进行建模,求解强化学习相关任务,其主要思想是利用先验分布估计未知参数的不确定性,然后通过获得的观察信息计算后验分布来学习知识。基于此,本文以策略迭...
- 尤树华
- 关键词:贝叶斯策略迭代高斯过程
- 一种新的基于值函数迁移的快速Sarsa算法被引量:3
- 2014年
- 知识迁移是当前机器学习领域的一个新的研究热点.其基本思想是通过将经验知识从历史任务到目标任务的迁移,达到提高算法收敛速度和收敛精度的目的.针对当前强化学习领域中经典算法收敛速度慢的问题,提出在学习过程中通过迁移值函数信息,减少算法收敛所需要的样本数量,加快算法的收敛速度.基于强化学习中经典的在策略Sarsa算法的学习框架,结合值函数迁移方法,优化算法初始值函数的设置,提出一种新的基于值函数迁移的快速Sarsa算法——VFT-Sarsa.该算法在执行前期,通过引入自模拟度量方法,在状态空间以及动作空间一致的情况下,对目标任务中的状态与历史任务中的状态之间的距离进行度量,对其中相似并满足一定条件的状态进行值函数迁移,而后再通过学习算法进行学习.将VTF-Sarsa算法用于Random Walk问题,并与经典的Sarsa算法、Q学习算法以及具有较好收敛速度的QV算法进行比较,实验结果表明,该算法在保证收敛精度的基础上,具有更快的收敛速度.
- 傅启明刘全尤树华黄蔚章晓芳