基于CNN的连续语音说话人声纹识别
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11959/j.issn.1000-0801.2017046

基于CNN的连续语音说话人声纹识别

引用
近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高.高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中最重要的模型.由于该模型对大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈.为了解决该问题,研究者开始关注深度学习技术.引入了CNN深度学习模型研究连续语音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法.模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量.实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果.

连续语音、语谱图、GMM-HMM、深度学习

33

TP393(计算技术、计算机技术)

浙江省自然科学基金资助项目LY16F020016;国家重点研发计划经费资助项目2016YFB0800201;浙江省重点科技创新团队项目No.2013TD03Zhejiang Natural Science Foundation of ChinaLY16F020016;National Key Research and Development Program of China2016YFB0800201;Zhejiang Province Science and Technology Innovation Program2013TD03

2017-04-19(万方平台首次上网日期,不代表论文的发表时间)

共8页

59-66

相关文献
评论
暂无封面信息
查看本期封面目录

电信科学

1000-0801

11-2103/TN

33

2017,33(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn