10.3969/j.issn.1673-629X.2017.06.022
基于ISODATA聚类算法的语音转换研究
提出了一种基于迭代自组织聚类算法(ISODATA)的双线性频率弯折语音转换模型.根据语音特征参数分类不充分产生残差成分的问题,在基于高斯混合模型的聚类过程中引入了迭代自组织聚类算法.该算法将聚类得到的类内均值作为训练模型初始均值,改善了EM算法初始值选取不当导致算法不能收敛的问题,从而对特征参数的拟合更加准确,结合后续的双线性频率弯折(BLFW)模型实现语音转换.实验测试结果表明:提出的算法具有较好的自适应聚类特性,能够使特征参数分类更合理,进而得到更准确的转换函数,使得转换的语音更接近目标语音.选择合适的初始值参数,对提出的算法与高斯混合模型及双线性频率弯折模型进行比较,平均MCD值相差很小,平均MOS值有所提高.这说明合理精确的聚类有利于提高语音转换系统的性能.
迭代自组织聚类算法、双线性频率弯折语音转换模型、残差成分、聚类特性
27
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61401227;江苏省博士后基金1402067B
2017-07-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
106-109