10.3969/j.issn.1000-3428.2004.10.052
基于增强学习的代理谈判模型
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型.将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值.代理可以通过修改信念函数及时间贴现率来调整报价.该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较.
代理、增强学习、报价、时间信念、价格信念
30
TP312(计算技术、计算机技术)
2004-06-25(万方平台首次上网日期,不代表论文的发表时间)
共3页
137-139