10.3969/j.issn.1672-6944.2016.15.047
基于粒子滤波的强化学习算法研究
文章分析了一种基于粒子滤波和强化学习的算法。该算法通过结合粒子滤波和Q-学习算法,得到一种基于粒子滤波和强化学习的机会频谱接入算法(RLPF)。实验结果表明,RLPF算法能够在策略空间直接进行全局搜索,这是对传统的基于局部搜索策略的强化学习算法的明显改善。
强化学习、粒子滤波、策略空间、全局搜索
TP3;TP1
南京交通职业技术学院高层次人才科研基金项目;项目编号No.2013。
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
110-112