DOI：10.3969/j.issn.1673-3215.2020.08.001

基于图像识别和神经网络技术的影视声音后期工艺探索

引用

摘要：

本研究选取实际工作中最常见的脚步编辑工作作为对象,基于开源的Openpose框架分析提取人物在画面中的运动姿态,进而利用支持向量机(SVM,Support Vector Ma-chine)和多层感知器(MLP,Multilayer Perception)这两种神经网络学习方法分别对Open-pose的数据进行处理,训练出针对于不同画面和运动情况的预测模型.在此过程中,对比了不同的预处理组合对模型拟合的影响,最终将其结果编码为多种音频工作站所能兼容的标准XML序列,尝试和探索在习惯、精度、实用性等方面均可接受的一种声音后期工艺的辅助手段.

关键词：声音编辑、图像识别、神经网络、机器学习、姿态推测

分类号：J933(电影、电视拍摄艺术与技术)

在线出版日期：2020-08-31（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：4-12,19

英文信息展示

期刊专题