10.16337/j.1004-9037.2015.02.011
基于自适应粒子群优化径向基函数神经网络的语音转换
语音转换是指在保持源说话人语义内容不变的前提下,通过改变源说话人的个性特征,使其听起来像目标说话人的语音。本文提出一种自适应粒子群优化算法训练径向基函数神经网络进行语音特征建模,以获取说话人谱包络的映射关系;此外,考虑到说话人谱包络参数与基频有着密切的联系,利用基于径向基函数神经网络的联合谱包络基频变换方法,将谱包络参数与基频联合进行建模和转换,使得转换后的基频含有更多的说话人个性特征。最后,运用主、客观方法对获得的转换语音进行性能测试。实验表明,与主流的基于高斯混合模型的语音转换相比,使用自适应粒子群优化的径向基函数神经网络方法能够获得更好的转换性能,且更加适用于男声到女声的转换。
语音转换、径向基函数神经网络、自适应粒子群优化、高斯混合模型、基频
TN912.3
江苏省高校自然科学研究重大13KJA510003;江苏高校优势学科建设工程;江苏省普通高校研究生科研创新计划CXLX12_0478资助项目。
2015-05-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
336-343