10.3778/j.issn.1002-8331.2011.11.033
基于GMM的说话人识别技术研究
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统.整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成.前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分.包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处.利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试.仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%.
高斯混合模型、语音活动检测、识别错误率
47
TP391.4(计算技术、计算机技术)
甘肃省自然科学基金the Natural Science Foundation of Gansu Province of China under Grant 1010RJZA046;甘肃省教育厅研究生导师基金项目0914ZTB003
2011-07-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
114-117