基于多Agent强化学习的流水线维护策略
在生产过程中,设备状态的衰变会影响产品质量,尽管设备仍能运行,但其成品率水平逐渐下降.针对由两台具有衰变质量状态的设备和一个库存缓冲组成的2M1B流水线系统,研究衰变设备的预防维护策略.每台设备可视为一个Agent,其预防维护问题被描述成半马氏决策过程模型,并与另一台设备的维护模型相关.以考虑系统全局即时成本为前提,提出了一种分布式的多Agent强化学习方法,获得两台设备在缓冲库存水平下的维护策略.学习所得的维护策略是典型的控制限型形式,即对于给定库存水平,当设备衰变至等于或劣于其相应的控制极限状态时,便触发维护行动.
预防维护、2M1B流水线、多Agent强化学习算法、半马氏决策过程、衰变的质量状态
28
TP273(自动化技术及设备)
国家自然科学基金资助项目60904075;国家杰出青年科学基金资助项目71125001
2013-11-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
702-708