基于强化学习的平行航班动态定价
由于平行航班之间的竞争越来越激烈,为提高航空公司收益,对机票销售系统中的航班和旅客分别建模.将航班的动态定价问题建模成马尔可夫博弈过程,对混合类型旅客建立Logit选择模型.利用多Agent的强化学习算法对实例进行求解,结果表明WoLF-PHC算法收敛所需迭代的次数大于Nash-Q算法,但在计算速度上WoLF-PHC算法优势明显,且具有较强的适应能力.此外,航空机票的定价策略与其他易逝品有所不同,整体呈现上升趋势.而旅客环境参数的变化,也会影响定价策略.基于WoLF-PHC算法得到的定价策略对于收益提升具有积极作用.
平行航班、混合型旅客、动态定价、马尔可夫博弈、强化学习
37
U-9(交通运输经济)
江苏省自然科学基金项目;中央高校基本科研业务费专项资金资助项目
2020-04-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
47-53