10.19734/j.issn.1001-3695.2022.01.0056
基于深度强化学习的生鲜产品联合库存控制与动态定价研究
针对生鲜产品的易逝性特征以及复杂多变的现实环境导致生鲜产品的最优订货和定价策略难以获得的问题,提出了基于深度强化学习方法的生鲜产品联合库存控制与动态定价方法,结合生鲜产品特性对问题进行建模并定义为马尔可夫决策过程,然后基于深度强化学习设计了生鲜品联合库存控制和动态定价算法.实验结果表明,基于深度强化学习的联合库存控制和动态定价策略收益表现最佳.因此,基于深度强化学习的联合库存控制和动态定价研究能够提高企业收益,有效促进强化学习在收益管理领域的落地,具有实际应用价值.
深度强化学习、收益管理、生鲜产品、库存控制、动态定价
39
TP391(计算技术、计算机技术)
国家自然科学基金71871231
2022-10-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
2660-2664