一种语音交互的纠错方法及装置
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种语音交互的纠错方法及装置

引用
本发明公开了一种语音交互的纠错方法及装置,涉及自然语言处理技术领域,提高对语音指令识别的准确性。本发明的主要技术方案为:当接收到用户发出的第一语音指令时,解析所述第一语音指令包含的语义信息和语调信息;接收第二语音指令,解析所述第二语音指令包含的语义信息和语调信息,所述第二语音指令是与所述第一语音指令互为相邻的语音指令;通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息,判断是否对所述第一语音指令执行纠正操作;若是,则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息。本发明主要应用于在处理输入的语音指令过程中自动地对接收到的相邻语音指令进行纠错。

发明专利

CN201910940847.0

2019-09-30

CN112669833A

2021-04-16

G10L15/22(2006.01)

北京安云世纪科技有限公司

杜国威

100016 北京市朝阳区酒仙桥路6号院2号楼1至17层102号内10层1002

北京律诚同业知识产权代理有限公司

王玉双

北京;11

1.一种语音交互的纠错方法,其特征在于,所述方法包括: 当接收到用户发出的第一语音指令时,解析所述第一语音指令包含的语义信息和语调信息; 接收第二语音指令,解析所述第二语音指令包含的语义信息和语调信息,所述第二语音指令是与所述第一语音指令互为相邻的语音指令; 通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息,判断是否对所述第一语音指令执行纠正操作; 若是,则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息。 2.根据权利要求1所述的方法,其特征在于,在所述接收到用户发出的第一语音指令之前,所述方法还包括: 获取所述用户对应的多条历史语音指令; 解析每条所述历史语音指令包含的语义信息和语调信息; 从多条所述历史语音指令中任意抽取相邻两条语音指令; 根据所述相邻两条语音指令分别对应的语义信息,判断所述相邻两条语音指令是否存在逻辑关联; 若存在,根据所述逻辑关联,创建标签,得到所述标签与所述逻辑关联之间的映射关系; 计算所述相邻两条语音指令分别对应的语调信息之间的差异信息,所述差异信息是在语音高低、语音快慢、语音长短和语音轻重四个维度上衡量语调变化信息; 利用所述标签标注所述差异信息,得到所述标签对应的语调变化信息。 3.根据权利要求2所述的方法,其特征在于,在所述得到所述标签对应的语调变化信息之后,所述方法还包括: 获取每个标签对应的语调变化信息; 通过任意抽取两个所述标签,比对两个所述标签对应的语调变化信息之间的相似度; 若所述相似度达到第一预设阈值时,整合两个所述标签得到一个上位标签,所述上位标签对应两组语调变化信息。 4.根据权利要求2所述的方法,其特征在于,在所述得到所述标签对应的语调变化信息之后,所述方法还包括: 解析每个标签的词语含义; 通过比较词语的相似性,将所述标签与预设标签模板上记载的标签进行匹配,所述预设标签模板用于规范所述标签; 若匹配成功,则利用所述预设标签模板上记载的标签替代所述标签; 若经匹配操作之后存在多个相同的标签,则将所述多个相同的标签进行去重处理并保留一个标签,所述标签对应多组语调变化信息。 5.根据权利要求2-4中任一项所述的方法,其特征在于,所述通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息,判断是否对所述第一语音指令执行纠正操作,包括: 在语音高低、语音快慢、语音长短和语音轻重四个维度上,分别计算所述第一语音指令和所述第二语音指令之间的差异信息; 通过将所述差异信息与标签对应的语调变化信息相比较,计算所述差异信息与所述标签对应的语调变化信息之间的相似度是否达到第二预设阈值; 若是,则通过查找标签与逻辑关联之间的映射关系,根据所述标签,确定所述第一语音指令和所述第二语音指令之间存在的逻辑关联; 当确定所述第一语音指令和所述第二语音指令之间的逻辑关联是纠正关系时,判定对所述第一语音指令执行纠正操作。 6.根据权利要求1所述的方法,其特征在于,在所述接收第二语音指令之后,所述方法还包括: 识别所述第二语音指令是否是包含否定词的词语组合; 若是,则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息; 若否,则通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息,判断是否对所述第一语音指令执行纠正操作。 7.一种语音交互的纠错装置,其特征在于,所述装置包括: 解析单元,用于当接收到用户发出的第一语音指令时,解析所述第一语音指令包含的语义信息和语调信息; 接收单元,用于接收第二语音指令; 所述解析单元,还用于解析所述第二语音指令包含的语义信息和语调信息,所述第二语音指令是与所述第一语音指令互为相邻的语音指令; 判断单元,用于通过比较所述解析单元解析得到的第二语音指令包含的语调信息和所述解析单元解析得到的第一语音指令包含的语调信息,判断是否对所述第一语音指令执行纠正操作; 纠正单元,用于当所述判断单元判断对所述第一语音指令执行纠正操作时,则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息。 8.根据权利要求7所述的装置,其特征在于,所述装置还包括: 获取单元,用于在所述接收到用户发出的第一语音指令之前,获取所述用户对应的多条历史语音指令; 所述解析单元,还用于解析每条所述历史语音指令包含的语义信息和语调信息; 抽取单元,用于从所述获取单元获取到的多条所述历史语音指令中任意抽取相邻两条语音指令; 所述判断单元,用于根据所述抽取单元抽取的相邻两条语音指令分别对应的语义信息,判断所述相邻两条语音指令是否存在逻辑关联; 创建单元,用于当所述判断单元判断所述相邻两条语音指令是存在逻辑关联时,根据所述逻辑关联,创建标签,得到所述标签与所述逻辑关联之间的映射关系; 计算单元,用于计算所述抽取单元抽取的所述相邻两条语音指令分别对应的语调信息之间的差异信息,所述差异信息是在语音高低、语音快慢、语音长短和语音轻重四个维度上衡量语调变化信息; 标注单元,用于利用所述创建单元创建的标签标注所述差异信息,得到所述标签对应的语调变化信息。 9.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如权利要求1-6中任一项所述的语音交互的纠错方法。 10.一种电子设备,其特征在于,所述电子设备包括存储介质和处理器; 所述处理器,适于实现各指令;所述存储介质,适于存储多条指令; 所述指令适于由所述处理器加载并执行如权利要求1-6中任一项所述的语音交互的纠错方法。
相关文献
评论
法律状态详情>>
2021-04-16公开
相关作者
相关机构