10.13335/j.1000-3673.pst.2020.0808
基于强化学习的增量配电网实时随机调度方法
电动汽车(electric vehicle,EV)及其他分布式资源正大规模地渗透到增量配电网中,使其调度问题成为一个充满随机性、高维的多阶段优化问题.因此基于强化学习框架,提出一种增量配电网实时随机优化调度算法.首先,将增量配电网的实时调度描述成一个多阶段随机序贯决策问题,并提出原问题的动态规划公式,构造表征当前决策对后续所有时段影响的值函数;利用决策后状态值函数代替期望值的计算,从而避免了增量配电网的随机性;利用基于时序差分TD(1)的策略迭代算法在大量模拟场景下训练值函数,得到收敛的近似值函数;将近似值函数投入在线运行进而得出配电网每时刻的近似全局最优调度方案.该算法避免了EV、可再生能源等数据预测误差的影响,有效应对各类能源随机性给优化调度带来的挑战.仿真算例表明,该算法收敛速度快,鲁棒性强,计算时间不受EV接入数量的影响,与其他算法对比更具可行性和经济性.
大规模分布式能源、增量配电网、实时调度、随机性、强化学习、近似动态规划法
44
TM61;TM7(发电、发电厂)
国家自然科学基金51777078
2020-09-21(万方平台首次上网日期,不代表论文的发表时间)
共11页
3321-3330,中插13-中插14