基于图像和声纹识别的语音控制方法、系统和车辆
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

基于图像和声纹识别的语音控制方法、系统和车辆

引用
本发明提供了一种基于图像和声纹识别的语音控制方法、系统和车辆,该方法包括:采集用户的语音指令;根据所述语音指令对用户进行声纹识别,得出声纹识别结果;获取用户的图像信息;根据所述声纹识别结果和所述图像信息对用户进行鉴别,得出鉴别结果,包括:根据所述声纹识别结果和所述图像信息判断所述用户的优先级,得出所述用户的优先级结果;根据所述鉴别结果执行所述语音指令,包括:根据所述优先级结果执行所述语音指令。根据用户优先级执行相应的语音指令,避免当多个用户同时发出语音指令,且语音指令冲突时,会出现执行混乱的情况,使得语音控制变得更加有序和安全。

发明专利

CN201910220610.5

2019-03-22

CN111724797A

2020-09-29

G10L17/22(2013.01)

比亚迪股份有限公司

阮洲;叶将涛

518118 广东省深圳市坪山新区比亚迪路3009号

广东;44

1.一种基于图像和声纹识别的语音控制方法,其特征在于,包括以下步骤: 采集用户的语音指令; 根据所述语音指令对用户进行声纹识别,得出声纹识别结果; 获取用户的图像信息; 根据所述声纹识别结果和所述图像信息对用户进行鉴别,得出鉴别结果,包括:根据所述声纹识别结果和所述图像信息判断所述用户的优先级,得出所述用户的优先级结果; 根据所述鉴别结果执行所述语音指令,包括:根据所述优先级结果执行所述语音指令。 2.如权利要求1所述的基于图像和声纹识别的语音控制方法,其特征在于,所述优先级包括:驾驶员优先级和乘客优先级,其中,驾驶员优先级高于乘客优先级。 3.如权利要求2所述的基于图像和声纹识别的语音控制方法,其特征在于, 根据所述优先级结果执行所述语音指令具体包括: 当所述优先级结果包括所述驾驶员优先级和乘客优先级时,只执行驾驶员的语音指令,不执行乘客的语音指令。 4.如权利要求1所述的基于图像和声纹识别的语音控制方法,其特征在于, 所述优先级包括:管理者优先级、授权用户优先级和普通用户优先级,其中,管理者优先级高于授权用户优先级,授权用户优先级高于普通用户优先级。 5.如权利要求4所述的基于图像和声纹识别的语音控制方法,其特征在于, 根据所述优先级结果执行所述语音指令具体包括: 当所述优先级结果包括至少两个优先级时,若所述语音指令不冲突,则执行全部所述语音指令;若所述语音指令冲突,且优先级不同,则执行优先级高的用户的语音指令;若所述语音指令冲突,且优先级相同,则执行最后采集的语音指令; 当所述优先级结果只包括一个优先级时,若所述语音指令不冲突,则执行全部所述语音指令;若所述语音指令冲突,则执行最后采集的语音指令。 6.如权利要求1所述的基于图像和声纹识别的语音控制方法,其特征在于, 根据所述声纹识别结果和所述图像信息对用户进行鉴别,得出鉴别结果,还包括:根据所述声纹识别结果和所述图像信息,判断出所述用户的年龄和情绪。 7.如权利要求6所述的基于图像和声纹识别的语音控制方法,其特征在于,所述语音指令包括:播放音频或视频; 根据所述鉴别结果执行所述语音指令,还包括:根据所述用户的年龄和情绪选择适合该年龄和情绪的视频或音频进行播放。 8.一种基于图像和声纹识别的语音控制系统,其特征在于,包括: 语音采集模块,所述语音采集模块用于采集用户的语音指令; 语音处理模块,所述语音处理模块用于根据所述语音指令对用户进行声纹识别,得出声纹识别结果; 图像采集模块,所述图像采集模块用于获取用户的图像信息; 鉴别模块,所述鉴别模块用于根据所述声纹识别结果和所述图像信息对用户进行鉴别,得出鉴别结果,包括:根据所述声纹识别结果和所述图像信息判断所述用户的优先级,得出所述用户的优先级结果; 执行模块,所述执行模块用于根据所述鉴别结果执行所述语音指令,包括:根据所述优先级结果执行所述语音指令。 9.如权利要求8所述的基于图像和声纹识别的语音控制系统,其特征在于,所述优先级包括:驾驶员优先级和乘客优先级,其中,驾驶员优先级高于乘客优先级。 10.如权利要求9所述的基于图像和声纹识别的语音控制系统,其特征在于,所述执行模块具体用于:当所述优先级结果包括所述驾驶员优先级和乘客优先级时,所述执行模块只执行驾驶员的语音指令,不执行乘客的语音指令。 11.如权利要求8所述的基于图像和声纹识别的语音控制系统,其特征在于,所述优先级包括:管理者优先级、授权用户优先级和普通用户优先级,其中,管理者优先级高于授权用户优先级,授权用户先级高于普通用户优先级。 12.如权利要求11所述的基于图像和声纹识别的语音控制系统,其特征在于,所述执行模块具体用于: 当所述优先级结果包括所述至少两个优先级时,若所述语音指令不冲突,则所述执行模块执行全部所述语音指令;若所述语音指令冲突,且优先级不同,则所述执行模块执行优先级高的用户的语音指令;若所述语音指令冲突,且优先级相同,则所述执行模块执行最后采集的语音指令; 当所述优先级结果只包括一个优先级时,若所述语音指令不冲突,则所述执行模块执行全部所述语音指令;若所述语音指令冲突,则所述执行模块执行最后采集的语音指令。 13.如权利要求8所述的基于图像和声纹识别的语音控制系统,其特征在于,还包括:选择模块,所述选择模块用于选择第一优先级和第二优先级,其中,所述第一优先级包括驾驶员优先级和乘客优先级,且驾驶员优先级高于乘客优先级;所述第二优先级包括管理者优先级、授权用户优先级和普通用户优先级,且管理者优先级高于授权用户优先级,授权用户先级高于普通用户优先级。 14.如权利要求8所述的基于图像和声纹识别的语音控制系统,其特征在于,所述鉴别模块还用于根据所述声纹识别结果和所述图像信息,判断出所述用户的年龄和情绪。 15.如权利要求14所述的基于图像和声纹识别的语音控制系统,其特征在于, 所述语音指令包括:播放音频或视频; 所述执行模块还用于根据所述用户的年龄和情绪,选择适合该年龄和情绪的视频或音频进行播放。 16.一种车辆,其特征在于,包括权利要求8-15任一项所述的基于图像和声纹识别的语音控制系统。
相关文献
评论
法律状态详情>>
2020-09-29公开
2020-09-29公开
相关作者
相关机构