基于Q学习的适应性进化规划算法
进化规划中,个体选择变异策略特别重要.适应性变异策略因在进化过程中动态选择个体变异策略,能够取得较好的性能.传统适应性变异策略都依据个体一步进化效果考察个体适应性,没有从多步进化效果上对变异策略进行评价.本文提出一种新的基于Q学习的适应性进化规划算法QEP (Q learning based evolutionary programming),该算法将变异策略看成行动,考察个体多步进化效果,并通过计算Q函数值,学习个体最优变异策略.实验表明,QEP能够获得好的性能.
进化规划、变异策略、Q学习、收益
34
TP18(自动化基础理论)
国家自然科学基金90612003;山东省中青年科学家科研奖励基金2006BS01020;山东省自然科学基金Y2007G16
2008-09-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
819-822