可扩展的动态类语言建模方法和系统
该文档总体上描述了用于使用基于类的语言模型动态地适应用于用户的个体话音查询的语音识别的系统和方法。该方法可以包括在数据处理硬件处接收用户说出的语音查询;数据处理硬件获取与语音查询相关联的上下文数据;数据处理硬件使用语言模型生成用于所述语音查询的候选转录序列,所述候选转录序列包括表示所述语言模型的语言的词汇表外术语的基于类的符号;数据处理硬件基于上下文数据获取属于特定类别的用户特定术语列表;数据处理硬件通过将所获取的用户特定术语列表合并到语言模型中来更新语言模型;以及数据处理硬件使用更新的语言模型生成用于所述语音查询的转录,该转录包括一系列术语,该一系列术语包括从用户特定术语列表中选择的用户特定术语之一,以代替基于类的符号。
发明专利
CN202010493186.4
2016-12-30
CN111710333A
2020-09-25
G10L15/197(2013.01)
谷歌有限责任公司
J.M.谢伊纳;P.阿勒克西克
美国加利福尼亚州
北京市柳沈律师事务所
金玉洁
美国;US
1.一种方法,包括: 在数据处理硬件处接收用户说出的语音查询; 数据处理硬件获取与语音查询相关联的上下文数据; 数据处理硬件使用语言模型生成用于所述语音查询的候选转录序列,所述候选转录序列包括表示所述语言模型的语言的词汇表外术语的基于类的符号; 数据处理硬件基于上下文数据获取属于特定类别的用户特定术语列表; 数据处理硬件通过将所获取的用户特定术语列表合并到语言模型中来更新语言模型;以及 数据处理硬件使用更新的语言模型生成用于所述语音查询的转录,该转录包括一系列术语,该一系列术语包括从用户特定术语列表中选择的用户特定术语之一,以代替基于类的符号。 2.根据权利要求1所述的方法,其中,所述语言模型包括n元语法语言模型。 3.根据权利要求1所述的方法,其中,基于类的符号基于上下文数据与用户特定术语列表所属的特定类别相关联。 4.根据权利要求1所述的方法,其中,基于与语音查询相关联的上下文数据从多个基于类的符号中选择基于类的符号,所述多个基于类的符号中的每个基于类的符号对应到各自不同的类别。 5.根据权利要求1所述的方法,其中,所述数据处理硬件驻留在与所述用户相关联的用户设备上。 6.根据权利要求5所述的方法,其中,所述语言模型是在与所述用户设备通信的远程服务器上训练的。 7.根据权利要求1所述的方法,其中,生成用于所述语音查询的所述转录包括:通过从所述用户特定术语列表中识别哪个用户特定术语最类似于语音查询的对应部分的发音转录,从用户特定术语列表中选择所述用户特定术语之一以代替所述基于类的符号。 8.根据权利要求1所述的方法,其中,所获取的用户特定术语列表包括用户的联系人列表。 9.根据权利要求1所述的方法,其中,所获取的用户特定术语列表包括与所述用户相关联的媒体播放器应用中的歌曲标题的列表。 10.根据权利要求1所述的方法,其中,所述候选转录序列包括字词网格。 11.一种系统,包括: 数据处理硬件;和 与数据处理硬件通信并存储指令的存储器硬件,该指令在由数据处理硬件执行时使数据处理硬件执行一个或多个操作,包括: 接收用户说出的语音查询; 获取与语音查询相关联的上下文数据; 使用语言模型生成用于所述语音查询的候选转录序列,所述候选转录序列包括表示所述语言模型的语言的词汇表外术语的基于类的符号; 基于上下文数据获取属于特定类别的用户特定术语列表; 通过将获取的用户特定术语列表合并到语言模型中来更新语言模型;以及 使用更新的语言模型生成用于语音查询的转录,该转录包括一系列术语,该一系列术语包括从用户特定术语列表中选择的用户特定术语之一以代替基于类的符号。 12.根据权利要求11所述的系统,其中,所述语言模型包括n元语法语言模型。 13.根据权利要求11所述的系统,其中,基于上下文数据,基于类的符号与用户特定术语列表所属的特定类别相关联。 14.根据权利要求11所述的系统,其中,基于与语音查询相关联的上下文数据从多个基于类的符号中选择基于类的符号,所述多个基于类的符号中的每个基于类的符号对应到各自不同的类别。 15.根据权利要求11所述的系统,其中,所述数据处理硬件驻留在与所述用户相关联的用户设备上。 16.根据权利要求15所述的系统,其中,所述语言模型是在与所述用户设备通信的远程服务器上训练的。 17.根据权利要求11所述的系统,其中,生成用于所述语音查询的所述转录包括:通过从所述用户特定术语列表中识别哪个用户特定术语最类似于语音查询的对应部分的发音转录,从用户特定术语列表中选择所述用户特定术语之一以代替所述基于类的符号。 18.根据权利要求11所述的系统,其中,所获取的用户特定术语列表包括用户的联系人列表。 19.根据权利要求11所述的系统,其中,所获取的用户特定术语列表包括与所述用户相关联的媒体播放器应用中的歌曲标题的列表。 20.根据权利要求11所述的系统,其中,所述候选转录序列包括字词网格。