10.3969/j.issn.1001-506X.2011.06.34
基于遗传算法的Skinner操作条件反射学习模型
以概率自动机(probabilistic automata,PA)为平台,结合遗传算法(genetic algorithm,GA)的进化思想,设计了反映Skinner操作条件反射(operant conditioning,OC)思想的仿生学习模型,称为基于遗传算法的操作条件反射概率自动机(genetic algorithm-operant conditioning probabilistic automata,GA-OCPA)学习系统.每一次学习尝试之后,首先,学习系统把通过OC学习算法学习得到的信息熵值作为个体适应度;然后,执行遗传算法,搜索最优的个体;最后,再执行OC学习算法学习最优个体内的最优操作行为,以得到新的信息熵值.理论上分析了GA-OCPA学习系统学习算法的收敛性,通过对两轮机器人运动平衡控制的仿真分析,表明设计的GA-OCPA学习系统的学习是一个自动获取知识和提炼的过程,具有高度的自适应能力.
操作条件反射、遗传算法、概率自动机、运动平衡控制
33
TP18(自动化基础理论)
国家自然科学基金60774077;国家高技术研究发展计划863计划2007AA04Z226;北京市教委重点项目KZ200810005002资助课题
2011-10-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
1370-1376