基于对话的语音识别
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

基于对话的语音识别

引用
实施例通过将包括对话树的多个节点聚类成至少第一集群和第二集群来提供基于对话的语音识别。为第一集群创建自然语言句子的第一数据集并且为第二集群创建自然语言句子的第二数据集;基于第一数据集生成与第一集群相关联的第一专用语言模型(LM);以及基于第二数据集生成与第二集群相关联的第二专用LM,其中第一专用LM不同于第二专用LM。

发明专利

CN202010153304.7

2020-03-06

CN111667833A

2020-09-15

G10L15/26(2006.01)

国际商业机器公司

J·诺吉马;M·C·格拉维;C·S·平哈内茨

美国纽约阿芒克

北京市金杜律师事务所

酆迅%彭梦晔

美国;US

1.一种方法,包括: 将包括对话树的多个节点聚类成至少第一集群和第二集群; 为所述第一集群创建自然语言句子的第一数据集并且为所述第二集群创建自然语言句子的第二数据集; 基于所述第一数据集生成与所述第一集群相关联的第一专用语言模型(LM);以及 基于第二数据集生成与所述第二集群相关联的第二专用LM,其中所述第一专用LM不同于所述第二专用LM。 2.根据权利要求1所述的方法,其中所述第一专用LM包括的词汇量少于所述对话树的领域特定LM,并且所述第二专用LM包括的词汇量少于所述领域特定LM,其中所述第一专用LM包括从所述第二专用LM中排除的词语并且所述第二专用LM包括从所述第一专用LM中排除的词语。 3.根据权利要求1所述的方法,其中对所述多个节点进行聚类还包括: 接收所述多个节点中的每个节点的样本句子;以及 基于所述样本句子中包括的共享词汇对所述多个节点中的节点进行分组。 4.根据权利要求1所述的方法,其中对所述多个节点进行聚类还包括: 观察通过所述对话树的先前会话流;以及 基于包括所述多个节点的子集的会话流的频率对所述多个节点中的节点进行分组。 5.根据权利要求1所述的方法,还包括: 在所述对话树的第一节点处接收第一话语,其中所述第一节点属于所述第一集群; 基于所述第一节点属于所述第一集群,选择所述第一LM以用于将所述第一话语转换为第一文本; 从根据所述第一LM从所述第一话语转换得到的所述第一文本中确定第一意图; 基于所述第一意图导航到所述对话树中的第二节点,其中所述第二节点属于所述第二集群; 接收第二话语; 基于所述第二节点属于所述第二集群,选择所述第二LM以用于将所述第二话语转换为第二文本; 从根据所述第二LM从所述第二话语转换得到的所述第二文本中确定第二意图;以及 基于所述第二意图导航到所述对话树中的第三节点。 6.根据权利要求5所述的方法, 其中导航到所述对话的所述第二节点包括基于所述第二节点向用户传输第一自然语言响应;以及 其中导航到所述对话的所述第三节点包括基于所述第三节点向所述用户传输第二自然语言响应。 7.根据权利要求5所述的方法,还包括: 其中基于所述第一专用LM将所述第一话语转换为文本包括从所述第一专用LM中选择具有匹配所述第一话语的最高置信度得分的词汇; 其中基于所述第二专用LM将所述第二话语转换为文本包括从所述第二专用LM中选择具有匹配所述第二话语的最高置信度得分的词汇; 响应于匹配所述第一话语的所述最高置信度得分和匹配所述第二话语的所述最高置信度得分中的至少一个低于置信度阈值,请求所述对话的节点的重新聚类以及所述第一专用LM和所述第二专用LM的更新中的至少一项。 8.根据权利要求5所述的方法,还包括:响应于标识通过所述对话树的导航频率的变化,请求所述对话的节点的重新聚类以及所述第一专用LM和所述第二专用LM的更新中的至少一项。 9.根据权利要求5所述的方法,还包括: 接收第三话语; 基于所述第二专用LM将所述第三话语转换为第三文本;以及 基于从所述第三文本确定的第三意图,导航到所述对话的第四节点,其中所述第四节点属于所述第一集群。 10.一种系统,包括: 导航跟踪器,被配置为在对话树中标识当前节点并且选择与所述当前节点相关联的专用LM; 语音到文本转换器,被配置为接收自然语言语音的话语并且基于为所述当前节点选择的所述专用LM将所述话语转换为文本;以及 对话服务,被配置为基于所述文本来在所述当前节点与所述对话树中的后续节点之间导航,其中导航到所述后续节点发信号通知所述导航跟踪器在所述对话树中标识所述后续节点,并且选择与所述后续节点相关联的新的专用LM以用于所述语音到文本转换器在将后续话语转换为文本时使用。 11.根据权利要求10所述的系统,其中多个专用LM被存储以用于与所述语音到文本转换器一起使用,其中存储的专用LM的数目与所述对话树中的节点的集群的数目相对应。 12.根据权利要求11所述的系统,其中所述对话树中的所述节点的集群基于在给定集群的节点的训练句子中共享的词汇将包括所述对话树的节点分组在一起。 13.根据权利要求11所述的系统,其中所述对话树中的所述节点的集群基于包括给定集群的节点的历史会话流将包括所述对话树的节点分组在一起。 14.一种包括指令的计算机可读存储介质,所述指令在由处理器执行时使得所述处理器能够执行包括以下各项的操作: 将包括对话树的多个节点聚类成至少第一集群和第二集群; 为所述第一集群创建自然语言句子的第一数据集并且为所述第二集群创建自然语言句子的第二数据集; 基于所述第一数据集生成与所述第一集群相关联的第一专用语言模型(LM);以及 基于所述第二数据集生成与所述第二集群相关联的第二专用LM,其中所述第一专用LM不同于所述第二专用LM。 15.根据权利要求14所述的计算机可读存储介质,其中所述第一专用LM包括的词汇量少于所述对话树的领域特定LM,并且所述第二专用LM包括的词汇量少于所述领域特定LM,其中所述第一专用LM包括从所述第二专用LM中排除的词语并且所述第二专用LM包括从所述第一专用LM中排除的词语。 16.根据权利要求14所述的计算机可读存储介质,其中对所述多个节点进行聚类还包括: 接收所述多个节点中的每个节点的样本句子;以及 基于所述样本句子中包括的共享词汇对所述多个节点中的节点进行分组。 17.根据权利要求14所述的计算机可读存储介质,其中对所述多个节点进行聚类还包括: 观察通过所述对话树的先前会话流;以及 基于包括所述多个节点的子集的会话流的频率对所述多个节点中的所述节点进行分组。 18.根据权利要求14所述的计算机可读存储介质,还包括: 在所述对话树的第一节点处接收第一话语,其中所述第一节点属于所述第一集群; 基于所述第一节点属于所述第一集群,选择所述第一LM以用于将所述第一话语转换为第一文本; 从根据所述第一LM从所述第一话语转换得到的所述第一文本中确定第一意图; 基于所述第一意图导航到所述对话树中的第二节点,其中所述第二节点属于所述第二集群; 接收第二话语; 基于所述第二节点属于所述第二集群,选择所述第二LM以用于将所述第二话语转换为第二文本; 从根据所述第二LM从所述第二话语转换得到的所述第二文本中确定第二意图;以及 基于所述第二意图导航到所述对话树中的第三节点。 19.根据权利要求18所述的计算机可读存储介质,其中导航到所述对话的所述第二节点包括基于所述第二节点向用户传输第一自然语言响应;以及 其中导航到所述对话的所述第三节点包括基于所述第三节点向所述用户传输第二自然语言响应。 20.根据权利要求18所述的计算机可读存储介质,还包括: 接收第三话语; 基于所述第二专用LM将所述第三话语转换为第三文本;以及 基于从所述第三文本确定的第三意图,导航到所述对话的第四节点,其中所述第四节点属于所述第一集群。 21.一种系统,包括分别用于执行根据权利要求1至9中任一项所述的方法的步骤的模块。 22.一种计算机程序产品,包括计算机可读存储介质,所述计算机可读存储介质具有利用其实现的程序指令,所述程序指令由计算设备可执行以引起所述计算设备执行根据权利要求1至9中任一项所述的方法的步骤。
相关文献
评论
法律状态详情>>
2020-09-15公开
2020-09-15公开
相关作者
相关机构