一种车载语音处理方法及车载信息娱乐系统

引用

摘要：

本申请公开了一种车载语音处理方法及车载信息娱乐系统，该方法包括：获取至少两个用户的实时图像；根据所述至少两个用户的实时图像，识别所述至少两个用户是否存在正在进行交互的对象；若存在，则识别所述至少两个用户的目标交互对象；根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理，避免了机械地将车内的所有语音数据采用同样的规则进行识别及处理，导致车载信息娱乐系统容易被误唤醒的问题。

专利类型：发明专利

申请/专利号：CN202110509345.X

申请日期：2021-05-11

公开/公告号：CN112951216A

公开/公告日：2021-06-11

主分类号：G10L15/08(2006.01)

申请/专利权人:宁波均联智行科技股份有限公司

发明/设计人:杨凤丽

主申请人地址:315040 浙江省宁波市高新区冬青路555号5号楼4楼

专利代理机构:北京市万慧达律师事务所

代理人:陈怡

国别省市代码:浙江;33

权利要求：

1.一种车载语音处理方法，其特征在于，应用于车载信息娱乐系统，所述方法包括：获取至少两个用户的实时图像；根据所述至少两个用户的实时图像，识别所述至少两个用户是否存在正在进行交互的对象；若存在，则识别所述至少两个用户的目标交互对象；根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理。 2.根据权利要求1所述的车载语音处理方法，其特征在于，所述根据所述至少两个用户的实时图像，识别所述至少两个用户是否存在正在进行交互的对象；若存在，则识别所述至少两个用户的目标交互对象，包括：根据所述至少两个用户的实时图像，识别所述至少两个用户的姿态数据；根据所述至少两个用户的姿态数据，识别所述至少两个用户是否存在正在进行交互的对象；若存在，根据所述至少两个用户的姿态数据，识别所述至少两个用户的目标交互对象。 3.根据权利要求2所述的车载语音处理方法，其特征在于，所述姿态数据包括实时唇部动作，所述根据所述至少两个用户的姿态数据，识别所述至少两个用户的目标交互对象包括：根据所述至少两个用户的实时唇部动作判断所述至少两个用户是否处于互相交谈状态；当判断所述至少两个用户处于互相交谈状态时，确定所述至少两个用户的目标交互对象为车内用户。 4.根据权利要求2所述的车载语音处理方法，其特征在于，所述姿态数据包括注视方向，所述根据所述至少两个用户的姿态数据，识别所述至少两个用户的目标交互对象包括：对于所述至少两个用户中的用户，若该用户的注视方向为预设方向，或者，若该用户的注视方向所望向的车内位置与预设的目标位置的距离不超过预设距离阈值，则确定该用户的目标交互对象为所述车载信息娱乐系统。 5.根据权利要求2所述的车载语音处理方法，其特征在于，所述姿态数据包括身体姿势，所述根据所述至少两个用户的姿态数据，识别所述至少两个用户的目标交互对象包括：对于所述至少两个用户中的用户，若该用户的身体姿势满足相应的预设条件，则确定该用户的目标交互对象为车内用户。 6.根据权利要求2所述的车载语音处理方法，其特征在于，所述根据所述至少两个用户的实时图像，识别所述至少两个用户的姿态数据后，所述方法还包括：当识别到的所述至少两个用户的姿态数据包含预设面部表情时，通过预设图像设备和/或预设语音设备推送所述预设面部表情对应的安抚信息。 7.根据权利要求1至6中任一项所述的车载语音处理方法，其特征在于，所述根据所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理，包括：根据所述至少两个用户的目标交互对象，确定所述至少两个用户中是否存在目标交互对象为所述车载信息娱乐系统的用户；若所述至少两个用户中存在目标交互对象为所述车载信息娱乐系统的用户，采用第一语音识别规则对采集的所述车内实时语音数据进行识别及处理；或，若所述至少两个用户中不存在目标交互对象为所述车载信息娱乐系统的用户，采用第二语音识别规则对采集的所述车内实时语音数据进行识别及处理；或，若无法确定所述至少两个用户中是否存在所述目标交互对象为车载信息娱乐系统的用户，采用第三语音识别规则对采集的所述车内实时语音数据进行识别及处理；其中，所述第一语音识别规则、所述第二语音识别规则及所述第三语音识别规则所包括的待识别语音关键词不完全相同。 8.根据权利要求7所述的车载语音处理方法，其特征在于，所述采用第一语音识别规则对采集的所述车内实时语音数据进行识别及处理，包括：识别采集的目标交互对象为所述车载信息娱乐系统的用户的实时语音数据是否包括预设高级热词和/或预设低级热词；在识别到所述目标交互对象为所述车载信息娱乐系统的用户的实时语音数据包括所述预设高级热词和/或预设低级热词时，根据对应的反馈规则生成相应的反馈结果并返回；所述采用第二语音识别规则对采集的所述车内实时语音数据进行识别及处理，包括：识别采集的所述车内实时语音数据是否包括所述预设高级热词和/或预设唤醒词；在识别到所述车内实时语音数据包括所述预设高级热词和/或预设唤醒词时，根据对应的反馈规则生成相应的反馈结果并返回；所述采用第三语音识别规则对采集的所述车内实时语音数据进行识别及处理，包括：识别采集的所述车内实时语音数据是否包括所述预设高级热词；在识别到所述车内实时语音数据包括所述预设高级热词时，根据对应的反馈规则生成相应的反馈结果并返回。 9.根据权利要求1所述的车载语音处理方法，其特征在于，所述方法还包括：若不存在，则不对采集的车内实时语音数据进行识别及处理。 10.一种车载信息娱乐系统，其特征在于，所述系统包括摄像头、车载控制系统及车载语音交互系统，其中，所述摄像头用于采集至少两个用户的实时图像；所述车载控制系统用于：根据所述至少两个用户的实时图像，识别所述至少两个用户是否存在正在进行交互的对象；若存在，则识别所述至少两个用户的目标交互对象；以及向所述车载语音交互系统发送包含所述至少两个用户的目标交互对象的消息；所述车载语音交互系统用于根据包含所述至少两个用户的目标交互对象的消息，采用所述至少两个用户的目标交互对象对应的语音识别规则对采集的车内实时语音数据进行识别及处理。

专利专题