多层视频语义概念分析与理解
基于统计学理论,提出了一种视频多粒度语义分析的通用方法,使得多层次语义分析与多模式信息融合得到统一.为了对时域内容进行表示,首先提出一种具有时间语义语境约束的关键帧选取策略和注意力选择模型;在基本视觉语义识别后,采用一种多层视觉语义分析框架来抽取视觉语义;然后应用隐马尔可夫模型(HMM)和贝叶斯决策进行音频语义理解;最后用一种具有两层结构的仿生多模式融合方案进行语义信息融合.实验结果表明,该方法能有效融合多模式特征,并提取不同粒度的视频语义.
视频语义分析、视频语义概念、层次隐马尔可夫模型、多模式融合
20
TP391(计算技术、计算机技术)
国家自然科学基金60273035;四川省教育厅资助项目2006B063;成都信息工程学院校科研和教改项目KYTZ20060904
2008-04-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
85-92