面向复杂环境的视频识别方法研究

引用

摘要：

随着人工智能的发展,视频识别技术取得了长足进步.然而,在许多应用场景中,获取的视频存在清晰度低、物体遮挡、场景复杂以及烟雾遮蔽等问题,使得智能模型的识别精度与速度下降.本文针对人体动作或行为识别、场景识别以及情感识别三个经典视频识别任务,分别就引入多源信息与基于视频单源信息两方面总结面向复杂环境视频的识别研究方法.多源信息主要介绍了引入与低质量视频同一环境下同一时间获取的识别目标的其他模态信息进行辅助识别的方法,这类方法通常将多元特征在隐式空间中对齐,以期获得特定于任务的联合表征,充分发挥多源信息的互补特性.单源信息主要介绍仅依靠视频自身时空信息或语义综合的方法,这类方法通常深度挖掘视频内容的空间语义特性以及时间编码特性,使得目标信息被凸显.

关键词：视频识别、多源信息、单源信息、复杂环境

所属期刊栏目：20

分类号：TP391.41;TP183(计算技术、计算机技术)

在线出版日期：2023-09-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：75-81

英文信息展示

期刊专题