情感语音数据转换方法、装置、计算机设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

情感语音数据转换方法、装置、计算机设备及存储介质

引用
本申请实施例属于人工智能技术领域,涉及一种情感语音数据转换方法及相关设备,可应用于智慧政务或智慧医疗领域,包括:获取源情感语音数据,基于预设的声码器提取所述源情感语音数据的第一基频、非周期数据和第一梅尔倒谱系数;通过线性变换将所述第一基频转换为第二基频,基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数,其中,所述预设转换模型为变分自编码器生成对抗网络结构;基于所述声码器对所述第二基频、所述第二梅尔倒谱系数和所述非周期数据进行傅里叶变换和自适应插值处理,得到目标情感数据。此外,本申请还涉及区块链技术,所述目标情感数据可存储于区块链中。本申请提高了情感语音数据的转换效率。

发明专利

CN202011364366.9

2020-11-27

CN112466314A

2021-03-09

G10L19/18(2013.01)

平安科技(深圳)有限公司

刘正晨;陈闽川;马骏;王少军;肖京

518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

深圳市世联合知识产权代理有限公司

汪琳琳

广东;44

1.一种情感语音数据转换方法,其特征在于,包括下述步骤: 获取源情感语音数据,基于预设的声码器提取所述源情感语音数据的第一基频、非周期数据和第一梅尔倒谱系数; 通过线性变换将所述第一基频转换为第二基频,基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数,其中,所述预设转换模型为变分自编码器生成对抗网络结构; 基于所述声码器对所述第二基频、所述第二梅尔倒谱系数和所述非周期数据进行傅里叶变换和自适应插值处理,得到目标情感数据。 2.根据权利要求1所述的情感语音数据转换方法,其特征在于,所述预设转换模型包括编码器、解码器和判别器,所述基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数的步骤包括: 获取所述源情感语音数据的情感标签,输入所述情感标签至所述编码器,得到情感信息表征,输入所述第一梅尔倒谱系数至所述编码器,得到内容信息表征; 输入所述情感信息表征和所述内容信息表征至所述解码器,得到所述第一梅尔倒谱系数对应的待测梅尔倒谱系数; 基于所述判别器确定所述待测梅尔倒谱系数是否为真实样本数据输出,在确定所述待测梅尔倒谱系数为所述真实样本数据输出时,确定所述待测梅尔倒谱系数为所述第二梅尔倒谱系数。 3.根据权利要求2所述的情感语音数据转换方法,其特征在于,所述输入所述情感标签至所述编码器,得到情感信息表征的步骤包括: 对所述情感标签进行独热编码得到独热矢量; 将所述独热矢量输入至所述编码器中的嵌入层,所述嵌入层输出得到所述情感信息表征。 4.根据权利要求2所述的情感语音数据转换方法,其特征在于,所述输入所述第一梅尔倒谱系数至所述编码器,得到内容信息表征的步骤包括: 根据所述编码器对所述第一梅尔倒谱系数进行多层卷积处理,得到所述内容信息表征。 5.根据权利要求1所述的情感语音数据转换方法,其特征在于,在所述基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数的步骤之前,包括: 获取第一对抗损失函数、第二对抗损失函数、循环一致损失函数、恒等变换损失函数和散度损失函数; 根据所述第一对抗损失函数、所述第二对抗损失函数、所述循环一致损失函数、所述恒等变换损失函数和所述散度损失函数,计算所述预设转换模型的最优损失函数,当所述最优损失函数取最小值时,确定所述预设转换模型为最优模型。 6.根据权利要求5所述的情感语音数据转换方法,其特征在于,所述根据所述第一对抗损失函数、所述第二对抗损失函数、所述循环一致损失函数、所述恒等变换损失函数和所述散度损失函数,计算所述预设转换模型的最优损失函数的步骤包括: 获取所述循环一致损失函数的第一约束值,以及所述恒等变换损失函数的第二约束值,根据所述第一约束值和所述第二约束值,分别计算所述循环一致损失函数的第一损失值和所述恒等变换损失函数的第二损失值; 对所述第一对抗损失函数、所述第二对抗损失函数、所述第一损失值、所述第二损失值和所述散度损失函数进行求和,计算得到所述最优损失函数。 7.根据权利要求1所述的情感语音数据转换方法,其特征在于,所述通过线性变换将所述第一基频转换为第二基频的步骤包括: 计算所述源情感语音数据的基频均值和基频标准差; 基于所述第一基频、所述基频均值和所述基频标准差,计算得到所述第一基频对应的所述第二基频。 8.一种情感语音数据转换装置,其特征在于,包括: 提取模块,用于获取源情感语音数据,基于预设的声码器提取所述源情感语音数据的第一基频、非周期数据和第一梅尔倒谱系数; 转换模块,用于通过线性变换将所述第一基频转换为第二基频,基于预设转换模型将所述第一梅尔倒谱系数转换为第二梅尔倒谱系数,其中,所述预设转换模型为变分自编码器生成对抗网络结构; 生成模块,用于基于所述声码器对所述第二基频、所述第二梅尔倒谱系数和所述非周期数据进行傅里叶变换和自适应插值处理,得到目标情感数据。 9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的情感语音数据转换方法的步骤。 10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的情感语音数据转换方法的步骤。
相关文献
评论
法律状态详情>>
2021-03-09公开
相关作者
相关机构