10.3969/j.issn.1003-0530.2007.02.027
基于基元段特征和GMM的源-目标说话人F0~t转换
基音轨迹F0~t转换是实现高质量源-目标说话人声音转换的重要组成部分.本文给出了一种与说话内容无关的F0~t转换方法,为了在与文本无关的前提下,提取出尽可能反映说话人个性特征的基音起伏的较长时的信息,本文采用了从n个短时帧组成的基元段提取特征矢量,并以基元段矢量为单元进行转换,采用了基于高斯混合模型(GMM)的概率加权转换算法使每个特征矢量的转换规则是由多个类规则的线性加权组合得到的,从而提高了转换精度,同时还解决了一般分类器中处于类边界数据的分类错误.实验表明,基于基元段特征矢量和GMM的转换方法具有很好的效果.
基音轨迹转换、与文本无关、混合高斯模型、基元段特征矢量
23
TN91
2007-10-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
283-287