用于语音识别的语音模型和噪声模型

引用

摘要：

接收由设备基于来自用户的音频输入生成的音频信号。该音频信号可以至少包括对应于由设备记录的一个或多个用户话语的用户音频部分。可以访问与用户相关联的用户语音模型，并且可以进行音频信号中的背景音频在定义阈值以下的确定。响应于确定音频信号中的背景音频在定义阈值以下，可以基于音频信号适配访问的用户语音模型以生成对用户的语音特性建模的适配用户语音模型。可以使用适配用户语音模型对接收的音频信号执行噪声补偿以生成与所述接收的音频信号相比具有减少的背景音频的滤波音频信号。

专利类型：发明专利

申请/专利号：CN201180026390.4

申请日期：2011-06-13

公开/公告号：CN103069480A

公开/公告日：2013-04-24

主分类号：G10L15/20(2006.01)I

申请/专利权人:谷歌公司

发明/设计人:M·I·洛伊德;T·克里斯特詹森

主申请人地址:美国加利福尼亚州

专利代理机构:北京市金杜律师事务所 11256

代理人:酆迅%辛鸣

国别省市代码:美国;US

权利要求：

一种系统，包括：一个或多个处理设备；以及一个或多个存储设备，其存储有指令，当所述指令被所述一个或多个处理设备执行时，使得所述一个或多个处理设备：接收由设备基于来自用户的音频输入生成的音频信号，所述音频信号至少包括对应于由所述设备记录的一个或多个用户话语的用户音频部分；访问与所述用户相关联的用户语音模型；确定所述音频信号中的背景音频在定义阈值以下；响应于确定所述音频信号中的所述背景音频在所述定义阈值以下，基于所述音频信号适配访问的用户语音模型以生成对所述用户的语音特性建模的适配用户语音模型；以及使用所述适配用户语音模型对接收的音频信号执行噪声补偿以生成与所述接收的音频信号相比具有减少的背景音频的滤波音频信号。

专利专题