公共文化服务平台

2025年1月6日星期一

|

欢迎来到海南省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

王海燕: 作品数：1 被引量：0H指数：0; 供职机构：苏州大学计算机科学与技术学院更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

王辉苏州大学计算机科学与技术学院
章鹏苏州大学计算机科学与技术学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

1篇中文期刊文章

领域

1篇自动化与计算...

主题

1篇迭代
1篇迭代算法

机构

1篇苏州大学

作者

1篇章鹏
1篇王海燕
1篇王辉

传媒

1篇电脑知识与技...

年份

1篇2014

共 1 条记录，以下是 1-1

全选清除导出

排序方式：

基于强化学习的值迭代算法: 2014年; 强化学习（Reinforcement Learning）是学习环境状态到动作的一种映射,并且能够获得最大的奖赏信号。强化学习中有三种方法可以实现回报的最大化：值迭代、策略迭代、策略搜索。该文介绍了强化学习的原理、算法,并对有环境模型和无环境模型的离散空间值迭代算法进行研究,并且把该算法用于固定起点和随机起点的格子世界问题。实验结果表明,相比策略迭代算法,该算法收敛速度快,实验精度好。; 崔军晓朱蒙婷王海燕章鹏王辉

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@海南省图书馆 2014－2015 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张