面向人机物三元数据的热轧调度问题研究
随着钢铁行业的数字化发展,其订单逐渐趋于多样化和随机化,这对热轧调度模型的适应性和灵活性等提出了新的要求.针对热轧调度问题,当前的主流方法是启发式算法,但其存在两个问题:一是没有考虑数据的组织表示;二是此类算法具有很强的针对性,当问题发生很小的改变就需要进行复杂的参数调整.相比之下,机器学习具有更好的适应性和灵活性,对此,采用本体进行人机物三元数据的组织表示,提出一种指针网络+强化学习的热轧调度求解方法.采用指针网络来学习序列到序列的映射,同时为解决指针网络训练困难和性能不高等问题,通过actor-critic网络进行训练,提高模型的准确性和收敛速度.最后,通过设计相应的实验对算法的性能进行仿真井与LK-H的局部搜索算法进行对比,进一步验证了所提出方法的有效性.
人机物三元数据;本体;热轧调度;指针网络;强化学习
36
TP18(自动化基础理论)
科技创新2030新一代人工智能重大项目课题2018AAA0101801
2021-10-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
2825-2832