基于视觉显著度的说话检测

引用

摘要：

现有基于视觉信息的说话检测方法中往往依赖预定参数或者阈值作为分类平面,鲁棒性差且泛化能力不强.针对这一问题,本文提出了一种基于显著度的视觉说话检测方法,利用像素的色彩信息和嘴唇的空间位置特性检测嘴唇,通过分析嘴唇运动和说话假设的关系,将图像能量作为特征,并结合经典的隐马尔科夫模型(hid den Markov models,HMM)和支持向量机(support vector machine,SVM)作为判决方法来进行检测.实验结果表明,本文提出的嘴唇检测方法正确率可达到92％.

关键词：显著度检测、视觉说话检测、图像能量、隐马尔科夫模型、支持向量机

所属期刊栏目：61

分类号：TN912.3

资助基金：国家自然科学基金重点项目61231015,61303114;国家高技术研究发展863计划2013AA014602资助项目;教育部高校博士点基金新教师类项目20130141120024;湖北省自然科学基金面上项目2014CFB712

在线出版日期：2015-10-08（万方平台首次上网日期，不代表论文的发表时间）

页码：363-367

英文信息展示

期刊专题