DOI：10.3969/j.issn.1673-4793.2020.01.001

基于平均音素模型的音色转换研究

引用

摘要：

音色转换技术能够在保留原有语句信息的基础上,使原说话人的声音特征向着目标用户的声音转变,从而达到用目标用户声音替换说话人声音的目的.在训练目标人音色时,传统方法需要大量的语料库进行训练.但是制作语料库花费很多的时间及人力,无法满足音色模板快速生成的需求,在实现个性化音色灵活性方面受到限制,很难扩展或显著改进.本文利用praat软件提取语音音素,通过GMM-UBM系统训练平均音素模型,利用较少的语音数据训练,从而实现在短时间小样本情况下个性化音色模型的建立,完成音色转换.主观实验表明,该方法达到了很好的音色转换效果.

关键词：音色转换、praat软件、GMM-UBM、平均音素模型

所属期刊栏目：27

分类号：TP273(自动化技术及设备)

资助基金：国家自然科学基金;中央高校基本科研业务费专项资金

在线出版日期：2020-06-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1-6

英文信息展示

期刊专题