10.11772/j.issn.1001-9081.2019020264
基于长短时记忆单元和卷积神经网络混合神经网络模型的视频着色方法
视频可以看作是连续的视频帧图像组成的序列,视频彩色化的实质是对图像进行彩色化处理,但由于视频的长期序列性,若直接将现有的图像着色方法应用到视频彩色化上极易产生抖动或闪烁现象.针对这个问题,提出一种结合长短时记忆(LSTM)和卷积神经网络(CNN)的混合神经网络模型用于视频的着色.该方法用CNN提取视频帧的语义特征,同时使用LSTM单元学习灰度视频的时序信息,保证视频的时空一致性,然后融合局部语义特征和时序特征,生成最终的彩色视频帧序列.通过对实验结果的定量分析和用户研究表明,该方法在视频彩色化上实现了较好的效果.
视频彩色化、长短时记忆、卷积神经网络、时空一致性
39
TP391.4(计算技术、计算机技术)
2019-10-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
2726-2730