10.3969/j.issn.1006-9348.2006.04.079
基于神经网络的强化学习算法实现倒立摆控制
运用强化学习的方法来对连续的倒立摆系统实现平衡控制是一直以来有待解决的问题.该文将Q学习与神经网络中的BP网络、S激活函数相结合,利用神经网络的泛化性能,设计出一种新的学习控制策略,通过迭代和学习过程,不但能够解决倒立摆系统连续状态空间的输入问题,还成功解决了输出连续动作空间的问题.将此方法运用于连续倒立摆系统的平衡控制中,经过基于实际控制模型的Matlab软件仿真实验,结果显示了这个方法的可行性.该方法进一步提高了强化学习理论在实际控制系统中的应用价值.
强化学习、神经网络、激活函数、泛化性能、连续动作空间
23
TP273.2(自动化技术及设备)
2006-06-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
298-300,325