用于语音识别的语音模型和噪声模型
接收由设备基于来自用户的音频输入生成的音频信号。该音频信号可以至少包括对应于由设备记录的一个或多个用户话语的用户音频部分。可以访问与用户相关联的用户语音模型,并且可以进行音频信号中的背景音频在定义阈值以下的确定。响应于确定音频信号中的背景音频在定义阈值以下,可以基于音频信号适配访问的用户语音模型以生成对用户的语音特性建模的适配用户语音模型。可以使用适配用户语音模型对接收的音频信号执行噪声补偿以生成与所述接收的音频信号相比具有减少的背景音频的滤波音频信号。
发明专利
CN201180026390.4
2011-06-13
CN103069480A
2013-04-24
G10L15/20(2006.01)I
谷歌公司
M·I·洛伊德;T·克里斯特詹森
美国加利福尼亚州
北京市金杜律师事务所 11256
酆迅%辛鸣
美国;US
一种系统,包括:一个或多个处理设备;以及一个或多个存储设备,其存储有指令,当所述指令被所述一个或多个处理设备执行时,使得所述一个或多个处理设备:接收由设备基于来自用户的音频输入生成的音频信号,所述音频信号至少包括对应于由所述设备记录的一个或多个用户话语的用户音频部分;访问与所述用户相关联的用户语音模型;确定所述音频信号中的背景音频在定义阈值以下;响应于确定所述音频信号中的所述背景音频在所述定义阈值以下,基于所述音频信号适配访问的用户语音模型以生成对所述用户的语音特性建模的适配用户语音模型;以及使用所述适配用户语音模型对接收的音频信号执行噪声补偿以生成与所述接收的音频信号相比具有减少的背景音频的滤波音频信号。