基于视频的三维人体姿态估计

引用

摘要：

已有的三维人体姿态估计方法侧重于通过单帧图像来估计人体的三维姿态,忽略了视频中前后帧之间的相关性,因此,通过挖掘视频在时间维度上的信息可以进一步提高三维人体姿态估计的准确率.基于此,设计了一种可以充分提取视频时序信息的卷积神经网络结构,在获得高精度的同时也具有消耗计算资源小的优点,仅仅使用二维关节点的坐标为输入即可恢复完整的三维人体姿态.然后提出了一种新的损失函数利用相邻帧间人体姿态的连续性,来改进视频序列中三维姿态估计的平滑性,同时也解决了因缺少帧间信息而导致准确率下降的问题.通过在公开数据集Human3.6M上进行测试,实验结果表明本文方法相比目前的基准三维姿态估计算法的平均测试误差降低了1.2 mim,对于视频序列的三维人体姿态估计有着较高的准确率.

关键词：三维人体姿态、卷积神经网络、视频序列、损失函数、平滑

所属期刊栏目：45

分类号：V221+.3;TB553(飞机构造与设计)

资助基金：国家自然科学基金;中央高校基本科研业务费专项

在线出版日期：2020-01-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：2463-2469

英文信息展示

期刊专题