语音交互方法、装置及测试机器人

引用

摘要：

本申请提供了一种语音交互方法、装置及测试机器人，本方案可以与电话银行系统中应答机器人(得到电子合成音)进行交互，也可以与电话银行系统中人工坐席(得到人工坐席的声音)进行交互，针对交互的对象不同，采取的获取相应文本答案的方式不同，若交互对象为应答机器人，那么，可以直接基于得到的第一语音对应的第一文本从知识库中获得第一文本答案；若交互对象为人工坐席，那么，需要获取与所述第二文本表征的所述人工坐席的意图相同的第三文本，知识库中包括第三文本，再基于第三文本从知识库中得到第二文本答案。从而实现了与电话银行系统进行语音交互的技术方案，即实现了非人工坐席对电话银行系统进行测试的目的。

专利类型：发明专利

申请/专利号：CN202010499878.X

申请日期：2020-06-04

公开/公告号：CN111613226A

公开/公告日：2020-09-01

主分类号：G10L15/26(2006.01)

申请/专利权人:中国银行股份有限公司

发明/设计人:张珍

主申请人地址:100818 北京市西城区复兴门内大街1号

专利代理机构:北京集佳知识产权代理有限公司

代理人:王娇娇

国别省市代码:北京;11

权利要求：

1.一种语音交互方法，其特征在于，包括：基于预先录入的电话银行系统的电话信息向所述电话银行系统外呼电话；若电话成功建立，获取来自所述电话银行系统的第一语音；获取所述第一语音的第一语音特征；将所述第一语音转换成第一文本；若所述第一信息表征所述第一语音为电子合成音，从知识库中获取与所述第一文本对应的第一文本答案；所述知识库包括多个文本分别对应的文本答案，所述多个文本包括所述第一文本；将所述第一文本答案转换成第一语音答案；将所述第一语音答案播放给所述电话银行系统；获取来自所述电话银行系统的第二语音；获取所述第二语音的第二语音特征；基于所述第二语音特征获得第二信息；将所述第二语音转换成第二文本；若所述第二信息表征所述第二语音为人工坐席的声音，获取与所述第二文本表征的所述人工坐席的意图相同的第三文本；从所述知识库中获得与所述第三文本对应的第二文本答案，所述多个文本包括所述第三文本；将所述第二文本答案转换成第二语音答案；将所述第二语音答案播放给所述电话银行系统。 2.根据权利要求1所述语音交互方法，其特征在于，所述获取与所述第二文本表征的所述人工坐席的意图相同的第三文本包括：获取所述第二文本包含的至少一个关键词；获取所述至少一个关键词的上下文信息，所述上下文信息包括所述至少一个关键词之间的语义关系；基于所述上下文信息以及所述至少一个关键词，从所述知识库中获得所述第三文本。 3.根据权利要求2所述语音交互方法，其特征在于，所述基于所述上下文信息以及所述至少一个关键词，从所述知识库中获得所述第三文本包括：基于所述上下文信息以及所述至少一个关键词，确定所述知识库包含的各文本表征所述人工坐席意图的可能性；将所述知识库包含的表征所述人工坐席意图的可能性最大的文本，确定为所述第三文本。 4.根据权利要求1所述语音交互方法，其特征在于，所述获取与所述第二文本表征的所述人工坐席的意图相同的第三文本包括：将所述第二文本输入至预构建的知识库文本确定模型；通过所述知识库文本确定模型获取所述知识库包含与所述第二文本对应的所述第三文本；其中，所述知识库文本确定模型具有将预测的与所述第二文本对应的所述第三文本表征的意图趋于所述第二文本表征的所述人工坐席的意图的能力。 5.根据权利要求1至4任一所述语音交互方法，其特征在于，所述基于所述第一语音特征获取第一信息包括：将所述第一语音特征与预存的电子合成音的语音特征进行匹配；基于所述第一语音特征与预存的电子合成音的语音特征的匹配结果，获得所述第一信息。 6.根据权利要求1至4任一所述语音交互方法，其特征在于，所述第一语音特征包括所述第一语音的振动频率和振动幅度，所述基于所述第一语音特征获取第一信息包括：将所述振动频率与预设频率阈值进行比较，得到第一比较结果；将所述振动幅度与预设幅度阈值进行比较，得到第二比较结果；基于所述第一比较结果与所述第二比较结果，获得所述第一信息。 7.根据权利要求1所述语音交互方法，其特征在于，还包括：获取所述电话银行系统针对所述第一语音答案的应答语音；基于所述应答语音是否匹配所述第一语音答案，获得表征所述电话银行系统应答语音的准确程度的第一测试结果。 8.根据权利要求1或7所述语音交互方法，其特征在于，还包括：若所述第二信息表征所述第二语音为人工坐席的声音，获得所述电话银行系统切换至人工坐席的转换时刻是否正确的第二测试结果。 9.一种语音交互装置，其特征在于，包括：外呼模块，用于基于预先录入的电话银行系统的电话信息向所述电话银行系统外呼电话；第一获取模块，用于若电话成功建立，获取来自所述电话银行系统的第一语音；第二获取模块，用于获取所述第一语音的第一语音特征；第三获取模块，用于基于所述第一语音特征获取第一信息；第一语音转文本模块，用于将所述第一语音转换成第一文本；第四获取模块，用于若所述第一信息表征所述第一语音为应答机器人的电子合成音，从知识库中获取与所述第一文本对应的第一文本答案；所述知识库包括多个文本分别对应的文本答案，所述多个文本包括所述第一文本；第一文本转语音模块，用于将所述第一文本答案转换成第一语音答案；第一播放模块，用于将所述第一语音答案播放给所述电话银行系统；第五获取模块，用于获取来自所述电话银行系统的第二语音；第六获取模块，用于获取所述第二语音的第二语音特征；第七获取模块，用于基于所述第二语音特征获得第二信息；第二语音转文本模块，用于将所述第二语音转换成第二文本；第八获取模块，用于若所述第二信息表征所述第二语音为人工坐席的声音，基于所述第二文本获取用于表征所述人工坐席意图的第三文本；第九获取模块，用于从所述知识库中获得与所述第三文本对应的第二文本答案，所述多个文本包括所述第三文本；第二文本转语音模块，用于将所述第二文本答案转换成第二语音答案；第二播放模块，用于将所述第二语音答案播放给所述电话银行系统。 10.一种测试机器人，其特征在于，包括：外呼装置；存储器，用于存储程序；处理器，用于执行所述程序，所述程序具体用于：控制所述外呼装置基于预先录入的电话银行系统的电话信息向所述电话银行系统外呼电话；若电话成功建立，获取来自所述电话银行系统的第一语音；获取所述第一语音的第一语音特征；基于所述第一语音特征获取第一信息；将所述第一语音转换成第一文本；若所述第一信息表征所述第一语音为应答机器人的电子合成音，从知识库中获取与所述第一文本对应的第一文本答案；所述知识库包括多个文本分别对应的文本答案，所述多个文本包括所述第一文本；将所述第一文本答案转换成第一语音答案；将所述第一语音答案播放给所述电话银行系统；获取来自所述电话银行系统的第二语音；获取所述第二语音的第二语音特征；基于所述第二语音特征获得第二信息；将所述第二语音转换成第二文本；若所述第二信息表征所述第二语音为人工坐席的声音，基于所述第二文本获取用于表征所述人工坐席意图的第三文本；从所述知识库中获得与所述第三文本对应的第二文本答案，所述多个文本包括所述第三文本；将所述第二文本答案转换成第二语音答案；将所述第二语音答案播放给所述电话银行系统。

专利专题