基于强化学习的平行航班动态定价

引用

摘要：

由于平行航班之间的竞争越来越激烈,为提高航空公司收益,对机票销售系统中的航班和旅客分别建模.将航班的动态定价问题建模成马尔可夫博弈过程,对混合类型旅客建立Logit选择模型.利用多Agent的强化学习算法对实例进行求解,结果表明WoLF-PHC算法收敛所需迭代的次数大于Nash-Q算法,但在计算速度上WoLF-PHC算法优势明显,且具有较强的适应能力.此外,航空机票的定价策略与其他易逝品有所不同,整体呈现上升趋势.而旅客环境参数的变化,也会影响定价策略.基于WoLF-PHC算法得到的定价策略对于收益提升具有积极作用.

关键词：平行航班、混合型旅客、动态定价、马尔可夫博弈、强化学习

所属期刊栏目：37

分类号：U-9(交通运输经济)

资助基金：江苏省自然科学基金项目;中央高校基本科研业务费专项资金资助项目

在线出版日期：2020-04-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：47-53

英文信息展示

期刊专题