10.3969/j.issn.1004-132X.2023.02.010
集成强化学习算法的柔性作业车间调度问题研究
将柔性作业车间调度问题转化为马尔可夫决策过程,提出了集成5种深度Q网络(DQN)优化的算法D5 QN.构建马尔可夫过程中,提取一组特征来表述状态,通过调度规则的组合设计出三组动作,通过直接和间接两种方式共同描述奖励.与基于规则、元启发式和其他强化学习算法的比较证明,所提方法可进一步缩短求解时间,并具有可行性和有效性.
作业调度、智能调度、马尔可夫决策过程、强化学习
34
TP39(计算技术、计算机技术)
国家自然科学基金;宁夏重点研发项目
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
201-207