基于Q学习算法的综合能源系统韧性提升方法
将综合能源系统随机动态优化问题建模为马尔可夫决策过程,并引入Q学习算法实现该复杂问题的求解.针对Q学习算法的弊端,对传统的Q学习算法做了2个改进:改进了Q值表初始化方法,采用置信区间上界算法进行动作选择.仿真结果表明:Q学习算法在实现问题求解的同时保证了较好的收敛性,改进的初始化方法和采用的置信区间上界算法能显著提高计算效率,使结果收敛到更优解;与常规混合整数线性规划模型相比,Q学习算法具有更好的优化结果.
综合能源系统、孤岛运行、马尔可夫决策过程、Q学习算法、韧性
40
TM73;TK01(输配电工程、电力网及电力系统)
国家电网公司科技项目;国家自然科学基金重点资助项目
2020-05-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
146-152