一种说话人声音转换方法

引用

摘要：

本发明公开了一种说话人声音转换方法，包括训练阶段和转换阶段，训练阶段包括：从源说话人和目标说话人的训练语音信号中分别提取基频特征、说话人特征和内容特征；根据所述基频特征构建基频转换函数；根据所述说话人特征构建说话人转换函数。转换阶段包括：从源说话人的待转换语音信号中提取基频特征和频谱特征；使用训练阶段得到的基频转换函数和说话人转换函数对从所述待转换语音信号中提取出的基频特征和说话人特征进行转换，得到转换后的基频特征和说话人特征；根据所得到的转换后的基频特征、说话人特征和待转换语音信号中的内容特征合成目标说话人的语音。本发明易于实现且转换后的音质和相似度较高。

专利类型：发明专利

申请/专利号：CN201210528629.4

申请日期：2012-12-11

公开/公告号：CN102982809A

公开/公告日：2013-03-20

主分类号：G10L25/30(2013.01)I

申请/专利权人:中国科学技术大学

发明/设计人:陈凌辉;戴礼荣;凌震华

主申请人地址:230026 安徽省合肥市包河区金寨路96号

专利代理机构:中科专利商标代理有限责任公司 11021

代理人:宋焰琴

国别省市代码:安徽;34

权利要求：

一种说话人声音转换方法，用于把源说话人所说的话的语音信号进行转换，使转换后的语音听起来是不同于源说话人的目标说话人所说的，其特征在于，该方法包括训练阶段和转换阶段，其中，所述训练阶段包括：步骤A1、从源说话人和目标说话人的训练语音信号中分别提取基频特征和频谱特征，所述频谱特征包括说话人特征和内容特征；步骤A2、根据源说话人和目标说话人的训练语音信号的基频特征，构建从源说话人的语音到目标说话人的语音的基频转换函数；步骤A3、根据步骤A1提取的源说话人和目标说话人的说话人特征构建说话人转换函数；所述转换阶段包括：步骤B1、从源说话人的待转换语音信号中提取基频特征和频谱特征，所述频谱特征包括说话人特征和内容特征；步骤B2、分别使用训练阶段得到的基频转换函数和说话人转换函数，对从步骤B1中从所述待转换语音信号中提取出的基频特征和说话人特征进行转换，得到转换后的基频特征和说话人特征；步骤B3、根据步骤B2得到的转换后的基频特征和说话人特征，以及步骤B1提取的待转换语音信号中的内容特征，合成目标说话人的语音。

专利专题