搬运系统作业分配问题的小脑模型关节控制器Q学习算法

引用

摘要：

研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在"维数灾"问题,传统的数值优化难以进行.根据小脑模犁关节控制器(CMAC)具有收敛速度快和适应性强的特点,运用该结构作为Q值函数的逼近器,并与Q学习和性能势概念相结合,给出了一种适用于平均或折扣性能准则的CMAC-Q学习优化算法.仿真结果说明,这种神经元动态规划方法比常规的Q学习算法具有节省存储空间,优化精度高和优化速度快的优势.

关键词：作业分配、Markov决策过程、Q学习、CMAC

所属期刊栏目：26

分类号：TP202(自动化技术及设备)

资助基金：国家自然科学基金资助项月60404009;安徽省自然科学基金资助项目090412046,070416242;安徽高校省级自然科学研究重点资助项目KJ2007A063,KJ2008A058;教育部留学回国人员科研启动基金

在线出版日期：2009-11-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：884-888

英文信息展示

期刊专题