语音控制方法、装置、电子设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音控制方法、装置、电子设备及存储介质

引用
本发明涉及一种语音控制方法、装置、电子设备及存储介质,所述方法应用于终端设备,包括:接收输入的语音控制命令,获取所述语音控制命令的识别结果;在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;根据查找结果,响应所述语音控制命令;其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。

发明专利

CN202010825753.1

2020-08-17

CN111968640A

2020-11-20

G10L15/22(2006.01)

北京小米松果电子有限公司

赖永永;方彦彬

100085 北京市海淀区西二旗中路33号院6号楼3层004号

北京博思佳知识产权代理有限公司

苑晨浩

北京;11

1.一种语音控制方法,其特征在于,应用于终端设备,所述控制方法包括: 接收输入的语音控制命令,获取所述语音控制命令的识别结果; 在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象; 根据查找结果,响应所述语音控制命令; 其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。 2.根据权利要求1所述的语音控制方法,其特征在于,所述逐级查找与所述识别结果匹配的执行对象,包括: 按照预设的优先级顺序在所述预设搜索范围内查找与所述识别结果匹配的所述执行对象,并在确定所述执行对象后停止查找。 3.根据权利要求2所述的语音控制方法,其特征在于,所述预设的优先级顺序为: 接收所述语音控制命令时终端设备的当前界面、接收所述语音控制命令时终端设备当前运行的至少一个应用程序和终端设备的系统的优先级依次降低。 4.根据权利要求1所述的语音控制方法,其特征在于,所述识别结果包括用于指示所述语音控制命令的执行对象的第一语义信息; 当预设搜索范围包括接收所述语音控制命令时终端设备的当前界面,所述查找与所述识别结果匹配的执行对象,包括: 获得对所述显示界面进行分割所得到的多个界面元素; 确定至少一个界面元素的目标信息,其中,所述目标信息包括所述界面元素的第二语义信息; 分别比较至少一个所述界面元素的第二语义信息和所述第一语义信息,若任一所述界面元素的第二语义信息与所述第一语义信息相匹配,则确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象。 5.根据权利要求4所述的语音控制方法,其特征在于,所述目标信息还包括所述界面元素的位置信息; 所述确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象,包括: 获取与所述第一语义信息相匹配的第二语义信息对应的界面元素; 根据获取的所述界面元素的所述位置信息,确定在所述显示界面的对应位置的所述界面元素为所述执行对象。 6.根据权利要求4所述的语音控制方法,其特征在于,所述识别结果还包括用于确定所述语音控制命令的控制内容的第三语义信息; 所述根据查找结果,响应所述语音控制命令,包括: 对所述执行对象执行与所述第三语义信息对应的操作。 7.根据权利要求1所述的语音控制方法,其特征在于,所述识别结果包括意图信息; 当预设搜索范围包括接收所述语音控制命令时终端设备当前运行的至少一个应用程序和/或终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括: 根据所述意图信息和应用程序支持的操作类型确定所述执行对象。 8.根据权利要求7所述的语音控制方法,其特征在于,当预设搜索范围为接收所述语音控制命令时终端设备当前运行的至少一个应用程序,所述查找与所述识别结果匹配的执行对象,包括: 获取终端设备当前运行的每个应用程序支持的至少一种操作类型对应的第四语义信息; 分别比较至少一个操作类型对应的第四语义信息与所述意图信息,若任一操作类型对应的第四语义信息与所述意图信息相匹配,则确定与所述意图信息匹配的第四语义信息对应的操作类型所属的应用程序为所述执行对象。 9.根据权利要求7所述的语音控制方法,其特征在于,当预设搜索范围为终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括: 获取所述系统的操作类型响应表中至少一个操作类型对应的第五语义信息,其中,所述操作类型响应表包括操作类型与响应程序的映射关系; 分别比较至少一个操作类型对应的第五语义信息与所述意图信息,若任一操作类型对应的第五语义信息与所述意图信息相匹配,则根据与所述意图信息匹配的第五语义信息对应的操作类型和所述操作类型响应表确定所述执行对象。 10.根据权利要求7所述的语音控制方法,其特征在于,所述识别结果还包括与所述意图信息对应的槽位信息以及各个槽位信息内的实体信息; 所述根据查找结果,响应所述语音控制命令,包括: 根据所述槽位信息以及各个槽位信息内的实体信息对所述执行对象执行对应的操作。 11.根据权利要求6或10所述的语音控制方法,其特征在于,所述根据查找结果,响应所述语音控制命令,还包括: 响应于未确定所述执行对象,生成提示信息,其中,所述提示信息用于指示所述终端设备无法执行所述语音控制命令。 12.一种语音控制装置,其特征在于,应用于终端设备,所述控制装置包括: 识别模块,用于接收输入的语音控制命令,获取所述语音控制命令的识别结果; 查找模块,用于在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象; 响应模块,用于根据查找结果,响应所述语音控制命令; 其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。 13.根据权利要求1所述的语音控制装置,其特征在于,所述查找模块具体用于: 按照预设的优先级顺序在所述预设搜索范围内查找与所述识别结果匹配的所述执行对象,并在确定所述执行对象后停止查找。 14.根据权利要求13所述的语音控制装置,其特征在于,所述预设的优先级顺序为: 接收所述语音控制命令时终端设备的当前界面、接收所述语音控制命令时终端设备当前运行的至少一个应用程序和终端设备的系统的优先级依次降低。 15.根据权利要求12所述的语音控制装置,其特征在于,所述识别结果包括用于指示所述语音控制命令的执行对象的第一语义信息; 当预设搜索范围包括接收所述语音控制命令时终端设备的当前界面,所述查找模块具体用于: 获得对所述显示界面进行分割所得到的多个界面元素; 确定至少一个界面元素的目标信息,其中,所述目标信息包括所述界面元素的第二语义信息; 分别比较至少一个所述界面元素的第二语义信息和所述第一语义信息,若任一所述界面元素的第二语义信息与所述第一语义信息相匹配,则确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象。 16.根据权利要求15所述的语音控制装置,其特征在于,所述目标信息还包括所述界面元素的位置信息; 所述查找模块用于确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象时,具体用于: 获取与所述第一语义信息相匹配的第二语义信息对应的界面元素; 根据获取的所述界面元素的所述位置信息,确定在所述显示界面的对应位置的所述界面元素为所述执行对象。 17.根据权利要求15所述的语音控制装置,其特征在于,所述识别结果还包括用于确定所述语音控制命令的控制内容的第三语义信息; 所述响应模块具体用于: 对所述执行对象执行与所述第三语义信息对应的操作。 18.根据权利要求12所述的语音控制装置,其特征在于,所述识别结果包括意图信息; 当预设搜索范围包括接收所述语音控制命令时终端设备当前运行的至少一个应用程序和/或终端设备的系统,所述查找模块具体用于: 根据所述意图信息和应用程序支持的操作类型确定所述执行对象。 19.根据权利要求18所述的语音控制装置,其特征在于,当预设搜索范围为接收所述语音控制命令时终端设备当前运行的至少一个应用程序,所述查找模块具体用于: 获取终端设备当前运行的每个应用程序支持的至少一种操作类型对应的第四语义信息; 分别比较至少一个操作类型对应的第四语义信息与所述意图信息,若任一操作类型对应的第四语义信息与所述意图信息相匹配,则确定与所述意图信息匹配的第四语义信息对应的操作类型所属的应用程序为所述执行对象。 20.根据权利要求18所述的语音控制装置,其特征在于,当预设搜索范围为终端设备的系统,所述查找模块具体用于: 获取所述系统的操作类型响应表中至少一个操作类型对应的第五语义信息,其中,所述操作类型响应表包括操作类型与响应程序的映射关系; 分别比较至少一个操作类型对应的第五语义信息与所述意图信息,若任一操作类型对应的第五语义信息与所述意图信息相匹配,则根据与所述意图信息匹配的第五语义信息对应的操作类型和所述操作类型响应表确定所述执行对象。 21.根据权利要求18所述的语音控制装置,其特征在于,所述识别结果还包括与所述意图信息对应的槽位信息以及各个槽位信息内的实体信息; 所述响应模块具体用于: 根据所述槽位信息以及各个槽位信息内的实体信息对所述执行对象执行对应的操作。 22.根据权利要求17或21所述的语音控制装置,其特征在于,所述响应模块具体用于: 响应于未确定所述执行对象,生成提示信息,其中,所述提示信息用于指示所述终端设备无法执行所述语音控制命令。 23.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于权利要求1至11任一项所述的方法进行语音控制。 24.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1至11任一项所述的方法。
相关文献
评论
法律状态详情>>
2020-11-20公开
2020-11-20公开
相关作者
相关机构