10.3969/j.issn.1007-757X.2000.02.006
采用模糊自适应评价的增强式学习控制
本文提出了基于模糊自适应评价(FLAC)的增强式学习(Reinforcement Learning)控制系统(FLAC/ASN),FLAC采用模糊规则表示学到的知识,因此可以有机地融入专家的经验.FLAC的学习方法为瞬时微分法(Temporal Difference).作用选择网络(ASN)采用多层前向网络.仿真结果表明(FLAC/ASN)具有很好的学习性能.
模糊、增强式学习、瞬时微分、神经网络
16
TP3(计算技术、计算机技术)
2004-04-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
19-21,12