融合音频单词与视觉特征的成人视频检测
基于多模态的检测方法是过滤成人视频的有效手段,然而现有方法中缺乏准确的音频语义表示方法.因此本文提出融合音频单词与视觉特征的成人视频检测方法.先提出基于周期性的能量包络单元(简称EE)分割算法,将音频流准确地分割为EE的序列;再提出基于EE和BoW(Bag-of-Words)的音频语义表示方法,将EE的特征描述为音频单词的出现概率;采用复合加权方法融合音频单词与视觉特征的检测结果;还提出基于周期性的成人视频判别算法,与基于周期性的EE分割算法前后配合,以充分利用周期性进行检测.实验结果表明,与基于视觉特征的方法相比,本文方法显著提高了检测性能.当误检率为9.76%时,检出率可达94.44%.
成人视频检测、多模态融合、音频单词、视觉特征、能量包络单元
17
TP391.41(计算技术、计算机技术)
国家重点基础研究发展计划973项目2007CB311105;国家自然科学基金项目60873165;北京市科技新星计划项目2007B071;北京市教育委员会共建项目
2012-10-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
791-797