2025年1月11日
星期六
|
欢迎来到海南省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
宋超峰
作品数:
2
被引量:2
H指数:1
供职机构:
天津大学电气与自动化工程学院
更多>>
发文基金:
国家教育部博士点基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
宗群
天津大学电气与自动化工程学院
孙正雅
天津大学电气与自动化工程学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
1篇
调度
1篇
动态调度
1篇
动态系统
1篇
学习算法
1篇
强化学习算法
1篇
离散事件动态
1篇
离散事件动态...
1篇
函数
1篇
函数逼近
1篇
R学习
1篇
LEARNI...
机构
2篇
天津大学
作者
2篇
宋超峰
1篇
孙正雅
1篇
宗群
传媒
1篇
系统仿真学报
年份
1篇
2007
1篇
2006
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于平均报酬强化学习的电梯群组调度研究
被引量:1
2007年
针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题特点的基础上,利用径向基函数神经网络解决行为值函数的存储与泛化问题,并结合电梯群组虚拟仿真环境进行验证。通过与两种典型的电梯群组调度算法进行比较,展示了平均报酬强化学习算法在处理具有吸收目标状态的大规模随机序贯决策问题的有效性及可行性。
宗群
孙正雅
宋超峰
关键词:
离散事件动态系统
基于平均型强化学习算法的动态调度方法的研究
论文主要研究了基于平均型强化学习算法的动态调度方法。 实际的动态调度问题往往呈现出很大的复杂性:动态调度是一类信息不完全的调度,在环境不确定和扰动因素的影响下,需要不断的改变调度策略,是调度策略优化的过程;动态...
宋超峰
关键词:
动态调度
R学习
函数逼近
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张