基于Q学习算法的综合能源系统韧性提升方法

引用

摘要：

将综合能源系统随机动态优化问题建模为马尔可夫决策过程,并引入Q学习算法实现该复杂问题的求解.针对Q学习算法的弊端,对传统的Q学习算法做了2个改进:改进了Q值表初始化方法,采用置信区间上界算法进行动作选择.仿真结果表明:Q学习算法在实现问题求解的同时保证了较好的收敛性,改进的初始化方法和采用的置信区间上界算法能显著提高计算效率,使结果收敛到更优解;与常规混合整数线性规划模型相比,Q学习算法具有更好的优化结果.

关键词：综合能源系统、孤岛运行、马尔可夫决策过程、Q学习算法、韧性

所属期刊栏目：40

分类号：TM73;TK01(输配电工程、电力网及电力系统)

资助基金：国家电网公司科技项目;国家自然科学基金重点资助项目

在线出版日期：2020-05-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：146-152

英文信息展示

期刊专题