10.19734/j.issn.1001-3695.2018.08.0585
基于信息熵和时间趋势的音频关注区域提取算法研究
音频信号某区域的关注情况受音频特征的影响,目前主要自下而上的关注区域提取算法大多将一维音频信号转至二维图像利用图像显著性算法进行分析,往往忽略了关注事件在时间维度上的持续性特征.针对此问题,基于音频信号的信息熵特征同时引入统计学时间趋势相关算法,通过对信号分帧求取信息熵值,再进行指数移动平均等计算得到关注度值,从而确定高关注区域.与当前的主流关注度提取算法进行对比,在很好检测到关注区域的起止点基础上,计算得到的关注度值整体更平滑,同时考虑了人耳听觉系统对某事件关注的持续性特点,通过对一段脱口秀节目音频进行实验,得到整体掌声笑声片段检出率为81.6%.
音频、关注区域、关注度计算、信息熵、时间趋势
36
TP391(计算技术、计算机技术)
国家自然科学基金面上项目;湖北省重大科技专项资助项目;湖北省自然科学基金青年项目;湖北省教育厅科学技术研究项目
2020-05-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
3652-3656