动态电源管理的随机切换模型与在线优化
考虑系统参数未知情况下的动态电源管理问题,提出一种基于强化学习的在线策略优化算法.通过建立事件驱动的随机切换分析模型,将动态电源管理问题转化为带约束的Markov决策过程的策略优化问题.利用此模型的动态结构特性,结合在线学习估计梯度与随机逼近改进策略,提出动态电源管理策略的在线优化算法.随机切换模型对电源管理系统的动态特性描述精确,在线优化算法自适应性强,运算量小,精度高,具有较高的实际应用价值.
动态电源管理、Markov决策过程、强化学习、梯度估计、随机逼近、在线优化
33
TP3(计算技术、计算机技术)
国家自然科学基金60574065;国家高技术研究发展计划863计划2005AA103320;安徽省自然科学基金050420301
2007-03-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
66-71