江苏省博士后科研资助计划项目(060211C)
- 作品数:5 被引量:104H指数:4
- 相关作者:刘全刘忠高阳姚望舒陈道蓄更多>>
- 相关机构:苏州大学南京大学吉林大学更多>>
- 发文基金:中国博士后科学基金江苏省高校自然科学研究项目江苏省博士后科研资助计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 强化学习算法研究被引量:10
- 2008年
- 针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna、Prioritized Sweeping、Sarsa)的基础上,对TD(λ)、Q_learning的算法进行分析,并将其应用到实验中。实验结果表明,强化学习中的、TD(λ)Q_learning等算法在不同情况下都能高效地解决避障等问题。
- 刘忠李海红刘全
- 关键词:Q学习机器人控制避障搜索引擎
- 一种逻辑强化学习的tableau推理方法被引量:4
- 2008年
- tableau方法是一种具有较强的通用性和适用性的推理方法,但由于函数符号、等词等的限制,使得自动推理具有不确定性.针对tableau推理中封闭集合构造过程具有盲目性的问题,提出将强化学习用于tableau自动推理的方法.该方法将tableau推理过程中的逻辑公式与强化学习相结合,产生抽象的状态和活动.这样一方面可以通过学习方法控制自动推理的推理顺序,形成合理的封闭分枝,减少推理的盲目性;另一方面复杂的推理可以利用简单的推理结果,提高推理的效率.
- 刘全崔志明高阳陈道蓄姚望舒
- 数据挖掘中聚类算法的新发展被引量:77
- 2008年
- 在对传统聚类方法进行简要介绍的基础上,对聚类的新发展进行了较详细的归纳,总结了聚类分类方法发展的趋势。
- 李明华刘全刘忠郗连霞
- 关键词:数据挖掘聚类分析聚类方法
- 一种基于启发式轮廓表的逻辑强化学习方法被引量:9
- 2008年
- 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.针对强化学习一直被"维数灾"问题所困扰的问题,提出在关系强化学习的基础上,引入启发式轮廓表的方法,采用含轮廓表的一阶谓词表示状态、活动和Q-函数,充分发挥Prolog表的优势,将逻辑谓词规则与强化学习相结合,形成一种新的逻辑强化学习方法——CCLORRL,并对其收敛性进行了证明.该方法使用轮廓形状谓词产生形状状态表,大幅度地减少状态空间;利用启发式规则指导动作的选择,减少了样本中不存在状态选择的盲目性.CCLORRL算法应用于俄罗斯方块中,实验表明,该方法是比较高效的.
- 刘全高阳陈道蓄孙吉贵姚望舒
- 关键词:维数灾谓词
- 一种基于集合符号的自动推理扩展方法被引量:4
- 2007年
- 在多值逻辑Tableau推理的基础上,提出了一种基于集合符号的自动推理扩展方法.将符号集合作为真值,减少了Tableau的推理分枝,并可以将适合经典逻辑的推理方法和策略应用于其中,使得非经典逻辑推理经典化.使用SWI-PROLOG语言设计实现了基于集合符号的自动推理系统,在系统中使用集合符号方法,只需要在规则库中增加推理规则,即可生成规则程序,系统本身不需要任何的修改,因此一些适合于经典逻辑的推理方法和技巧就可以很容易地应用到多值逻辑、模态逻辑、直觉逻辑等非经典逻辑,也可以进一步推广到无穷值逻辑和含模糊量词(如T-算子和S-算子)的逻辑中,对于无穷值逻辑和模糊逻辑的Tableau方法研究具有一定的借鉴作用.对TPTP中的900个逻辑问题进行了证明,实验结果表明,系统在时间和空间上效率都是较高的.
- 刘全伏玉琛孙吉贵崔志明龚声蓉凌兴宏
- 关键词:TABLEAU经典逻辑非经典逻辑