基于强化学习的地铁站空调系统节能控制
地铁站空调系统能源消耗较大,传统控制方法无法兼顾舒适性和节能问题,控制效果不佳,且目前地铁站空调控制系统均是对风系统和水系统单独控制,无法保证整个系统的节能效果.鉴于此,提出基于强化学习的空调系统节能控制策略.首先,采用神经网络建立空调系统模型,作为离线训练智能体的模拟环境,以解决无模型强化学习方法在线训练收敛时间长的问题;然后,为了提升算法效率,同时针对地铁站空调系统多维连续动作空间的特点,提出基于多步预测的深度确定性策略梯度算法,设计智能体框架,将其用于与环境模型进行交互训练;此外,为了确定最佳的训练次数,设置了智能体训练终止条件,进一步提升了算法效率;最后,基于武汉某地铁站的实测运行数据进行仿真实验,结果表明,所提出控制策略具有较好的温度跟踪性能,能够保证站台舒适性,且与目前实际系统相比能源节省约17.908%.
强化学习、深度确定性策略梯度法、神经网络、多步预测、地铁站空调系统、节能控制
37
TP273(自动化技术及设备)
北京市属高校高水平创新团队建设计划项目;北京市教委科技计划重点项目;北京建筑大学市属高校基本科研业务费专项资金项目
2022-12-06(万方平台首次上网日期,不代表论文的发表时间)
共10页
3139-3148