10.3969/j.issn.1673-3215.2020.08.001
基于图像识别和神经网络技术的 影视声音后期工艺探索
本研究选取实际工作中最常见的脚步编辑工作作为对象,基于开源的Openpose框架分析提取人物在画面中的运动姿态,进而利用支持向量机(SVM,Support Vector Ma-chine)和多层感知器(MLP,Multilayer Perception)这两种神经网络学习方法分别对Open-pose的数据进行处理,训练出针对于不同画面和运动情况的预测模型.在此过程中,对比了不同的预处理组合对模型拟合的影响,最终将其结果编码为多种音频工作站所能兼容的标准XML序列,尝试和探索在习惯、精度、实用性等方面均可接受的一种声音后期工艺的辅助手段.
声音编辑、图像识别、神经网络、机器学习、姿态推测
J933(电影、电视拍摄艺术与技术)
2020-08-31(万方平台首次上网日期,不代表论文的发表时间)
共10页
4-12,19