基于支持向量回归的乒乓球机器人击球策略学习方法
针对7自由度仿人型乒乓球机器人的定点回球问题,提出了一种基于支持向量回归的击球策略学习方法.首先,把机器人的击球过程形式化为击球评价函数,该函数以来球状态和击球轨迹参数为输入,以回报值为输出.然后,提出一种基于物理模型置信域的随机搜索方法以提高训练数据的采集效率,并基于ε支持向量回归(ε-SVR)对经验数据集进行泛化从而得到击球评价函数.最后,在决策过程中,采用多初值拟牛顿法最大化击球评价函数以求解出最优击球轨迹.将该方法应用于7自由度乒乓球机器人系统中,实验结果验证了其有效性.
乒乓球机器人、支持向量回归(SVR)、冗余自由度机械臂
36
TP24(自动化技术及设备)
国家973计划资助项目2013CB733105
2014-03-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
14-20