融合音频单词与视觉特征的成人视频检测

引用

摘要：

基于多模态的检测方法是过滤成人视频的有效手段,然而现有方法中缺乏准确的音频语义表示方法.因此本文提出融合音频单词与视觉特征的成人视频检测方法.先提出基于周期性的能量包络单元(简称EE)分割算法,将音频流准确地分割为EE的序列；再提出基于EE和BoW(Bag-of-Words)的音频语义表示方法,将EE的特征描述为音频单词的出现概率；采用复合加权方法融合音频单词与视觉特征的检测结果；还提出基于周期性的成人视频判别算法,与基于周期性的EE分割算法前后配合,以充分利用周期性进行检测.实验结果表明,与基于视觉特征的方法相比,本文方法显著提高了检测性能.当误检率为9.76％时,检出率可达94.44％.

关键词：成人视频检测、多模态融合、音频单词、视觉特征、能量包络单元

所属期刊栏目：17

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家重点基础研究发展计划973项目2007CB311105;国家自然科学基金项目60873165;北京市科技新星计划项目2007B071;北京市教育委员会共建项目

在线出版日期：2012-10-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：791-797

英文信息展示

期刊专题