一种车载语音处理方法及车载信息娱乐系统
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种车载语音处理方法及车载信息娱乐系统

引用
本申请公开了一种车载语音处理方法及车载信息娱乐系统,该方法包括:获取至少两个用户的实时图像;根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象;根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理,避免了机械地将车内的所有语音数据采用同样的规则进行识别及处理,导致车载信息娱乐系统容易被误唤醒的问题。

发明专利

CN202110509345.X

2021-05-11

CN112951216A

2021-06-11

G10L15/08(2006.01)

宁波均联智行科技股份有限公司

杨凤丽

315040 浙江省宁波市高新区冬青路555号5号楼4楼

北京市万慧达律师事务所

陈怡

浙江;33

1.一种车载语音处理方法,其特征在于,应用于车载信息娱乐系统,所述方法包括: 获取至少两个用户的实时图像; 根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象; 根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理。 2.根据权利要求1所述的车载语音处理方法,其特征在于,所述根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象,包括: 根据所述至少两个用户的实时图像,识别所述至少两个用户的姿态数据; 根据所述至少两个用户的姿态数据,识别所述至少两个用户是否存在正在进行交互的对象; 若存在,根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象。 3.根据权利要求2所述的车载语音处理方法,其特征在于,所述姿态数据包括实时唇部动作,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括: 根据所述至少两个用户的实时唇部动作判断所述至少两个用户是否处于互相交谈状态; 当判断所述至少两个用户处于互相交谈状态时,确定所述至少两个用户的目标交互对象为车内用户。 4.根据权利要求2所述的车载语音处理方法,其特征在于,所述姿态数据包括注视方向,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括: 对于所述至少两个用户中的用户,若该用户的注视方向为预设方向,或者,若该用户的注视方向所望向的车内位置与预设的目标位置的距离不超过预设距离阈值,则确定该用户的目标交互对象为所述车载信息娱乐系统。 5.根据权利要求2所述的车载语音处理方法,其特征在于,所述姿态数据包括身体姿势,所述根据所述至少两个用户的姿态数据,识别所述至少两个用户的目标交互对象包括: 对于所述至少两个用户中的用户,若该用户的身体姿势满足相应的预设条件,则确定该用户的目标交互对象为车内用户。 6.根据权利要求2所述的车载语音处理方法,其特征在于,所述根据所述至少两个用户的实时图像,识别所述至少两个用户的姿态数据后,所述方法还包括: 当识别到的所述至少两个用户的姿态数据包含预设面部表情时,通过预设图像设备和/或预设语音设备推送所述预设面部表情对应的安抚信息。 7.根据权利要求1至6中任一项所述的车载语音处理方法,其特征在于,所述根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理,包括: 根据所述至少两个用户的目标交互对象,确定所述至少两个用户中是否存在目标交互对象为所述车载信息娱乐系统的用户; 若所述至少两个用户中存在目标交互对象为所述车载信息娱乐系统的用户,采用第一语音识别规则对采集的所述车内实时语音数据进行识别及处理;或,若所述至少两个用户中不存在目标交互对象为所述车载信息娱乐系统的用户,采用第二语音识别规则对采集的所述车内实时语音数据进行识别及处理;或,若无法确定所述至少两个用户中是否存在所述目标交互对象为车载信息娱乐系统的用户,采用第三语音识别规则对采集的所述车内实时语音数据进行识别及处理; 其中,所述第一语音识别规则、所述第二语音识别规则及所述第三语音识别规则所包括的待识别语音关键词不完全相同。 8.根据权利要求7所述的车载语音处理方法,其特征在于, 所述采用第一语音识别规则对采集的所述车内实时语音数据进行识别及处理,包括: 识别采集的目标交互对象为所述车载信息娱乐系统的用户的实时语音数据是否包括预设高级热词和/或预设低级热词; 在识别到所述目标交互对象为所述车载信息娱乐系统的用户的实时语音数据包括所述预设高级热词和/或预设低级热词时,根据对应的反馈规则生成相应的反馈结果并返回; 所述采用第二语音识别规则对采集的所述车内实时语音数据进行识别及处理,包括: 识别采集的所述车内实时语音数据是否包括所述预设高级热词和/或预设唤醒词; 在识别到所述车内实时语音数据包括所述预设高级热词和/或预设唤醒词时,根据对应的反馈规则生成相应的反馈结果并返回; 所述采用第三语音识别规则对采集的所述车内实时语音数据进行识别及处理,包括: 识别采集的所述车内实时语音数据是否包括所述预设高级热词; 在识别到所述车内实时语音数据包括所述预设高级热词时,根据对应的反馈规则生成相应的反馈结果并返回。 9.根据权利要求1所述的车载语音处理方法,其特征在于,所述方法还包括: 若不存在,则不对采集的车内实时语音数据进行识别及处理。 10.一种车载信息娱乐系统,其特征在于,所述系统包括摄像头、车载控制系统及车载语音交互系统,其中, 所述摄像头用于采集至少两个用户的实时图像; 所述车载控制系统用于:根据所述至少两个用户的实时图像,识别所述至少两个用户是否存在正在进行交互的对象;若存在,则识别所述至少两个用户的目标交互对象;以及向所述车载语音交互系统发送包含所述至少两个用户的目标交互对象的消息; 所述车载语音交互系统用于根据包含所述至少两个用户的目标交互对象的消息,采用所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理。
相关文献
评论
法律状态详情>>
2021-06-11公开
2021-06-11公开
2021-06-11公开
相关作者
相关机构