王辉
- 作品数:28 被引量:81H指数:5
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术轻工技术与工程建筑科学文化科学更多>>
- 主动数据仓库规则模型及其相关语法的研究被引量:1
- 2009年
- 主动数据库的简单规则形式不符合主动数据仓库(ADW)的决策特点,而基于ADW的分析规则在交互性、精确性、表达能力和扩展性等方面存在不足。根据ADW规则渐进分析分布决策的特点,结合ECA规则形式,定义了一种主动多维分析规则模型及相应语法(AMAR)作为ADW规则的表述和执行方式。AMAR不仅可以应对ADW规则的诸多挑战,还提供了对立方体、事件、规则、结果之间复杂对应关系的支持,同时具备了更好的可维护性和可执行性。
- 陈凌王辉张广泉
- 关键词:主动数据仓库ECA
- 人体胸围曲线的拟合方法被引量:10
- 2009年
- 针对描点法获取的真实人体胸围的近似曲线,绘制其外接圆顺曲线,并通过比较各个函数的拟合效果,确定以三次多项式函数进行拟合,然后经过修正获得胸围曲线长度和胸宽、胸厚的函数关系,最后通过曲线缩放推算同号型下胸围的长度,为非接触式二维人体图像的自动测量提供围度计算算法。实验证明,采用本文方法拟合出来的函数曲线误差小,基本满足服装设计尺寸误差要求。
- 卢晨王辉尚笑梅张广泉
- 关键词:最小二乘拟合
- 一种不稳定环境下的策略搜索及迁移方法被引量:3
- 2017年
- 强化学习是一种Agent在与环境交互过程中,通过累计奖赏最大化来寻求最优策略的在线学习方法.由于在不稳定环境中,某一时刻的MDP模型在与Agent交互之后就发生了变化,导致基于稳定MDP模型传统的强化学习方法无法完成不稳定环境下的最优策略求解问题.针对不稳定环境下的策略求解问题,利用MDP分布对不稳定环境进行建模,提出一种基于公式集的策略搜索算法——FSPS.FSPS算法在学习过程中搜集所获得的历史样本信息,并对其进行特征信息的提取,利用这些特征信息来构造不同的用于动作选择的公式,采取策略搜索算法求解最优公式.在此基础之上,给出所求解策略的最优性边界,并从理论上证明了迁移到新MDP分布中策略的最优性主要依赖于MDP分布之间的距离以及所求解策略在原始MDP分布中的性能.最后,将FSPS算法用于经典的Markov Chain问题,实验结果表明,所求解的策略具有较好的性能.
- 朱斐刘全傅启明陈冬火王辉伏玉琛
- 一种基于线性函数逼近的离策略Q(λ)算法被引量:25
- 2014年
- 将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关联因子,在迭代次数逐步增长的过程中,使得在策略与离策略相统一,确保算法的收敛性.同时在保证在策略与离策略的样本数据一致性的前提下,对算法的收敛性给予理论证明.将文中提出的算法用于Baird反例、Mountain-Car及Random Walk仿真平台,实验结果表明,该算法与传统的基于函数逼近的离策略算法相比,具有较好的收敛性;与传统的基于查询表的算法相比,具有更快的收敛速度,且对于状态空间的增长具有较强的鲁棒性.
- 傅启明刘全王辉肖飞于俊李娇
- 关键词:函数逼近
- 基于高斯过程的路径规划研究
- 2014年
- 路径规划[1,2,3,4]是指按照某一性能标准搜索一条从起始状态到目标状态的最优或次优无碰路径。高斯过程指的是一组随机变量的集合,这个集合里面的任意有限个随机变量都服从联合高斯分布,它是一种普遍存在和重要的随机过程。由于其具有很强的普适性,所以在较复杂的未知情况下,适合用高斯过程来进行研究或者使用高斯过程模型来进行预识别。本文通过搭建物理模型,并采用MATLAB和eclipse编程工具对其进行实现,从而对各种条件下运行程序绘制的地图,进行对比分析。
- 邹青青汪笑宇崔晓龙王辉
- 关键词:路径规划高斯过程
- 基于加速度识别的姿态交互研究被引量:8
- 2009年
- 手势识别作为人机交互的一种重要实现技术一直是模式识别领域的研究热点之一。提出一种基于加速度的手势识别方法。首先为每个手势动作建立隐马尔可夫模型,通过采集到的手势动作的加速度值对模型进行优化,再利用优化的模型对加速度序列进行分类,根据加速度的不同对手势进行识别。该方法在手持移动设备上有良好的识别效果,对手持移动设备的交互研究具有重要意义。
- 孔俊其王辉张广泉
- 关键词:隐马尔可夫模型
- 一种二阶TD Error快速Q(λ)算法被引量:5
- 2013年
- Q(λ)学习算法是一种结合值迭代与随机逼近的思想的基于模型无关的多步离策略强化学习算法.针对经典的Q(λ)学习算法执行效率低、收敛速度慢的问题,从TD Error的角度出发,给出n阶TD Error的概念,并将n阶TD Error用于经典的Q(λ)学习算法,提出一种二阶TD Error快速Q(λ)学习算法——SOE-FQ(λ)算法.该算法利用二阶TD Error修正Q值函数,并通过资格迹将TD Error传播至整个状态动作空间,加快算法的收敛速度.在此基础之上,分析算法的收敛性及收敛效率,在仅考虑一步更新的情况下,算法所要执行的迭代次数T主要指数依赖于1/1-γ、1/ε.将SOE-FQ(λ)算法用于Random Walk和Mountain Car问题,实验结果表明,算法具有较快的收敛速度和较好的收敛精度.
- 傅启明刘全孙洪坤高龙李瑾王辉
- 关键词:ERROR
- 基于自动测体的围度曲线拟合模型被引量:8
- 2010年
- 通过拍摄人体正面和侧面的图像,提取其轮廓线形用于服装三维人体尺寸的自动测量技术。该技术成本低,转换后二维尺寸的计算简单快速,适合产品的商业化。(一般的计算方法是对人体围度进行样本分析,利用拟合方法获得不同号型样本的围度曲线函数模型,通过围度曲线的二维信息估计尺寸。)主要基于自动人体测量需要,在选取号型随机样本的试验基础上,使用指数曲线、对数曲线、二次曲线和三次曲线拟合其中胸围曲线,建立对应的围度函数模型并对其在误差和线形方面展开详细的分析与比较,论证这些模型的合理性与不足之处,为建立更适用的围度尺寸函数模型提供参考。
- 尚笑梅卢晨王辉
- 关键词:误差分析
- 集群式程序设计竞赛评测系统设计与开发被引量:5
- 2009年
- 随着ACM国际大学生程序设计竞赛ACM-ICPC(ACM-International Collegiate Programming Contest)以及类似程序设计竞赛的发展,一种能在线接收用户提交源代码、判断程序的对错并实时将结果通知用户的在线评测系统开始流行起来。此类系统对于程序设计竞赛的赛前训练以及比赛的组织都具有十分重要的作用。通过详细介绍程序设计竞赛在线评测系统的需求、原理、设计、实现以及集群计算在该系统中的运用,总结了该系统投入使用后所表现出的优势和问题。
- 王辉胡新华张广泉
- 关键词:程序设计竞赛在线评测系统集群计算
- 一种基于样本的人体躯干函数模型被引量:1
- 2011年
- 针对参数化静态人体躯干模型的参数量化比较困难、应用过程繁复的状况,建立了一种基于样本的人体躯干函数化模型。该模型使用身高、围度长度和围度宽厚信息等输入参数作为控制量,以获得的样本B样条曲线簇为模板,根据人体各部位比例确定曲线空间位置,利用放样曲面重建算法生成人体躯干模型的三维可视化曲面。建立的人体躯干模型包含了真实的人体躯干围度形态和宽厚信息,且这些尺寸信息容易获取、计算量小、建模速度快;根据输入的人体尺寸信息,对围度曲线模板进行相应的线性缩放或者全向加权约束调整,生成符合用户体型的人体躯干模型。
- 卢晨王辉张广泉