10.3969/j.issn.1000-8152.2007.02.029
一般和博弈中的合作多agent学习
理性和收敛是多agent学习研究所追求的目标.在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性.另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
多agent学习、一般和随机博弈、Nash平衡、Pareto占优、Q-学习
24
TP273(自动化技术及设备)
2007-06-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
317-321