语音交互设备和系统、设备控制方法、计算设备以及介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音交互设备和系统、设备控制方法、计算设备以及介质

引用
公开了一种语音交互设备、语音交互系统以及设备控制方法。该语音交互设备从物联网服务器接收并在本地的存储模块存储一个或多个设备的设备信息。语音交互模块与用户进行语音交互。语音交互设备本地的语音处理模块从语音交互模块接收到的语音中识别实体信息和意图信息。语音交互设备本地的设备管理模块向与实体信息对应的设备发送对应于意图信息的指令。通过在本地的语音交互设备上部署语音识别、自然语言理解和物联网设备控制指令封装模块,实现了物联网设备管理本地化,减少了云端链路上的网络开销,不需等待云端语音识别的结果,因此缩短了从用户说话到实现控制之间的响应时间,从而提升响应速度,改善用户体验。

发明专利

CN201910199373.9

2019-03-15

CN111696534A

2020-09-22

G10L15/18(2013.01)

阿里巴巴集团控股有限公司

杨昔水;胡聪钢;雷京颢;李奋;黄启生;李岳冰;刘兆健;刘畅;风翮

英属开曼群岛大开曼资本大厦一座四层847号邮箱

北京展翼知识产权代理事务所(特殊普通合伙)

屠长存

开曼群岛;KY

1.一种语音交互设备,其特征在于,包括: 存储模块,用于存储一个或多个设备的设备信息; 语音交互模块,用于与用户进行语音交互; 语音处理模块,用于从所述语音交互模块接收到的语音中识别实体信息和意图信息;以及 设备管理模块,用于根据所述存储模块存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。 2.根据权利要求1所述的语音交互设备,其特征在于,所述语音处理模块包括: 语音识别模块,用于将所述语音识别为文本; 置信度判断模块,用于判断所识别的文本的置信度是否达到预定置信度阈值;以及 自然语言理解模块,用于在判定所述置信度达到所述置信度阈值的情况下,对所识别的文本进行分析以得到所述实体信息和意图信息。 3.根据权利要求1所述的语音交互设备,其特征在于, 所述语音处理模块还从所述语音中识别与所述实体信息和/或所述意图信息相关联的属性信息, 所述设备管理模块根据所述属性信息确定与所述实体信息对应的设备,并且/或者基于所述属性信息生成对应于所述意图信息的指令。 4.根据权利要求1所述的语音交互设备,其特征在于, 设备的所述设备信息包括针对所述设备的指令的指令协议, 所述设备管理模块根据所述指令协议生成所述指令。 5.根据权利要求1所述的语音交互设备,其特征在于,还包括: 通信模块,用于与管理所述一个或多个设备的物联网服务器通信,从所述物联网服务器接收所述一个或多个设备的设备信息。 6.根据权利要求5所述的语音交互设备,其特征在于, 所述设备管理模块从所述存储模块查找与所述实体信息对应的设备的设备信息, 在查找到与所述实体信息对应的设备的设备信息的情况下,所述设备管理模块生成所述指令,并向所述实体信息对应的设备发送所述指令。 7.根据权利要求6所述的语音交互设备,其特征在于, 所述通信模块还用于与语音处理服务器通信,向语音处理服务器上传所述语音交互模块接收到的语音,以便所述语音处理服务器进行语音识别和自然语言理解,并向物联网服务器发送所述自然语言理解的结果, 在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,所述通信模块向所述语音处理服务器发送终止语音识别和/或自然语言理解的消息。 8.根据权利要求7所述的语音交互设备,其特征在于, 在所述设备管理模块没有查找到与所述实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于所述意图信息的操作的情况下,在所述语音交互模块判定所述语音结束后,所述通信模块向所述语音处理服务器发送语音结束消息, 所述语音处理服务器对语音识别得到的文本进行自然语言理解,并向物联网服务器发送所述自然语言理解的结果。 9.根据权利要求8所述的语音交互设备,其特征在于, 维护命中标记, 在所述设备管理模块查找到与所述实体信息对应的设备的设备信息以前,保持所述命中标记为表示没有命中的第一状态, 在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,将所述命中标记设置为表示命中的第二状态, 所述通信模块根据所述命中标记确定是否向所述服务器发送所述终止语音识别和/或自然语言理解的消息和/或所述语音结束消息。 10.根据权利要求5所述的语音交互设备,其特征在于, 所述通信模块分批次接收所述物联网服务器下发的设备信息,每个批次的数据量不超过预定数据量阈值。 11.根据权利要求1所述的语音交互设备,其特征在于, 所述一个或多个设备是与所述语音交互设备关联的设备;并且/或者 所述语音交互设备是智能音箱或者语音处理模组。 12.一种语音交互系统,其特征在于,包括: 一个或多个设备;以及 语音交互设备,其上存储有所述一个或多个设备的设备信息,用于与用户进行语音交互,从用户的语音中识别实体信息和意图信息,并根据所存储的设备信息向与所述实体信息对应的设备发送对应于所述意图信息的指令。 13.根据权利要求12所述的语音交互系统,其特征在于,还包括: 物联网服务器,管理所述一个或多个设备,并向所述语音交互设备下发所述一个或多个设备的设备信息。 14.根据权利要求13所述的语音交互设备,其特征在于, 所述物联网服务器分批次向所述语音交互设备下发所述设备信息,每个批次的数据量不超过预定数据量阈值。 15.根据权利要求13所述的语音交互系统,其特征在于,还包括: 语音处理服务器,从所述语音交互设备接收用户的语音,对所接收的语音进行语音识别和自然语言理解,并向物联网服务器发送所述自然语言理解的结果, 其中,在所述语音交互设备查找到与所述实体信息对应的设备的设备信息的情况下,所述通信模块向所述语音处理服务器发送终止语音识别和/或自然语言理解的消息, 在所述语音交互设备没有查找到与所述实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于所述意图信息的操作的情况下,在判定所述语音结束后,所述语音交互设备向所述语音处理服务器发送语音结束消息, 所述语音处理服务器响应于所述语音结束消息,向物联网服务器发送所述自然语言理解的结果。 16.根据权利要求12所述的语音交互系统,其特征在于,所述语音交互设备是根据权利要求1至11中任何一项所述的语音交互设备。 17.一种设备控制方法,其特征在于,包括: 本地存储一个或多个设备的设备信息; 将所接收到的语音识别为文本; 对所识别的文本进行分析以得到其中涉及的实体信息和意图信息;以及 根据本地存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。 18.根据权利要求17所述的设备控制方法,其特征在于, 所述设备控制方法由智能音箱设备执行,或者由语音处理模组执行。 19.根据权利要求17所述的设备控制方法,其特征在于, 所述设备包括物联网设备。 20.根据权利要求17所述的设备控制方法,其特征在于,所述实体信息对应的设备包括: 智能家居设备;和/或 与家居设备关联的处理模组。 21.根据权利要求17所述的设备控制方法,其特征在于,还包括: 判断所识别的文本的置信度是否达到预定置信度阈值, 其中,在判定所述置信度达到所述置信度阈值的情况下,对所识别的文本进行分析。 22.根据权利要求17所述的设备控制方法,其特征在于,还包括: 从管理所述一个或多个设备的物联网服务器接收所述一个或多个设备的设备信息。 23.根据权利要求17所述的设备控制方法,其特征在于,还包括: 维护命中标记, 在所述设备管理模块查找到与所述实体信息对应的设备的设备信息以前,保持所述命中标记为表示没有命中的第一状态, 在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,将所述命中标记设置为表示命中的第二状态, 在所述命中标记处于第二状态的情况下,所述通信模块向所述语音处理服务器发送终止语音识别和/或自然语言理解的消息, 在所述命中标记处于第一状态的情况下,在判定用户的语音结束后,所述通信模块向所述语音处理服务器发送语音结束消息。 24.一种计算设备,包括: 处理器;以及 存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求17-23中任何一项所述的方法。 25.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求17-23中任一项所述的方法。
相关文献
评论
法律状态详情>>
2020-09-22公开
2020-09-22公开
相关作者
相关机构