DOI：10.3969/j.issn.1006-8961.2003.11.019

基于SVM和ICA的视频帧字幕自动定位与提取

引用

摘要：

视频字幕蕴涵了丰富语义,可以用来对相应视频流进行高级语义标注,但由于先前视频字幕提取考虑的只是如何尽可能定义好字幕特征,而忽视了分类学习机自身的学习推广能力.针对这一局限性,提出了一种基于支持向量机和独立分量分析的视频帧字幕定位与提取算法.该算法是首先将原始图象帧分割成N×N大小子块,同时将每个子块标注为字幕块和非字幕块两类;然后从每个子块提取能够保持相互高阶独立的独立分量特征去训练支持向量机分类器;最后结合金字塔模型和去噪方法,用训练好的支持向量机来实现对视频字幕区域自动定位提取.由于支持向量机能够在样本不是很多的情况下,具有良好的分类推广能力以及能使独立成分特征之间彼此保持高阶独立性,与其他视频帧字幕定位提取算法比较的结果表明,该算法具有明显的优点.

关键词：模式识别(520·2040)、字幕定位、支持向量机、独立分量分析、金字塔模型

所属期刊栏目：8

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家自然科学基金60272031;高等学校博士学科点专项科研项目20010335049;国家科技攻关项目2001BA101A07-03;浙江省科技计划2003C21010

在线出版日期：2004-01-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：1334-1340

英文信息展示

期刊专题