10.16208/j.issn1000-7024.2020.09.034
基于时间卷积网络的深度聚类说话人语音分离
"鸡尾酒会问题"在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息.通过参考Jonathan等提出的深度聚类方法,在其基础上进行改进,提出基于时间卷及网络的深度聚类模型,以理想二值掩蔽作为分离目标并在公开中文语音数据集下进行实验.实验结果表明,相比传统深度聚类模型,所提模型在训练速度、分离后的语音质量和语音客观可懂度方面都得到了提升.
语音分离、深度聚类模型、时间卷积网络、膨胀卷积、因果卷积、理想二值掩蔽
41
TP181(自动化基础理论)
装备发展部信息系统局"十三五"预研课题基金项目;装备预研领域基金项目
2020-10-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
2630-2635