一种语音交互方法、装置、电子设备和介质

引用

摘要：

本公开公开了一种语音交互方法、装置、电子设备和介质，涉及计算机技术领域，尤其涉及语音技术、云计算及云服务技术领域。具体实现方案为：在与用户进行语音交互的过程中，对语音交互信息进行处理得到处理结果；根据所述处理结果生成交互引导图像；向用户展示所述交互引导图像，用于引导用户继续进行语音交互。本公开实现了根据交互引导图像，高效、生动且直观的引导用户进行语音交互的效果，改善了用户体验。

专利类型：发明专利

申请/专利号：CN202110245836.8

申请日期：2021-03-05

公开/公告号：CN112786048A

公开/公告日：2021-05-11

主分类号：G10L15/22(2006.01)

申请/专利权人:百度在线网络技术(北京)有限公司

发明/设计人:王峰磊

主申请人地址:100085 北京市海淀区上地十街10号百度大厦三层

专利代理机构:北京品源专利代理有限公司

代理人:孟金喆

国别省市代码:北京;11

权利要求：

1.一种语音交互方法，包括：在与用户进行语音交互的过程中，对语音交互信息进行处理得到处理结果；根据所述处理结果生成交互引导图像；向用户展示所述交互引导图像，用于引导用户继续进行语音交互。 2.根据权利要求1所述的方法，其中，所述根据所述处理结果生成交互引导图像，包括：在所述处理结果为语音识别功能已唤醒的情况下，生成包含有唤醒提示文字的拾音引导图像；其中，所述拾音引导图像用于提示所述用户语音识别功能已处于唤醒状态。 3.根据权利要求2所述的方法，其中，所述拾音引导图像中包括拾音符号；所述向用户展示所述交互引导图像，包括：以预设动画效果向所述用户展示所述拾音引导图像中的拾音符号。 4.根据权利要求3所述的方法，其中，所述预设动画效果包括渐隐渐现动画效果。 5.根据权利要求1所述的方法，其中，所述根据所述处理结果生成交互引导图像，还包括：在所述处理结果为用户语音识别结果的情况下，生成包含有所述用户语音识别结果的识别结果引导图像。 6.根据权利要求1所述的方法，其中，所述根据所述处理结果生成交互引导图像，还包括：在所述处理结果为用户意图识别结果的情况下，根据所述用户意图识别结果确定待反馈信息，并生成包含有所述待反馈信息的反馈信息引导图像。 7.根据权利要求1所述的方法，其中，根据不同处理结果所生成的交互引导图像具有不同的背景效果。 8.根据权利要求1所述的方法，其中，所述向用户展示所述交互引导图像，包括：生成语音交互产品的标志图像，并将所述语音交互产品的标志图像和所述交互引导图像共同展示给用户。 9.根据权利要求8所述的方法，其中，将所述语音交互产品的标志图像和所述交互引导图像共同展示给用户，包括：将所述语音交互产品的标志图像与所述交互引导图像进行图像拼接，并将得到的拼接图像向所述用户进行展示。 10.一种语音交互装置，包括：处理结果获取模块，用于在与用户进行语音交互的过程中，对语音交互信息进行处理得到处理结果；交互引导图像生成模块，用于根据所述处理结果生成交互引导图像；交互引导图像展示模块，用于向用户展示所述交互引导图像，用于引导用户继续进行语音交互。 11.根据权利要求10所述的装置，其中，所述交互引导图像生成模块，具体用于：在所述处理结果为语音识别功能已唤醒的情况下，生成包含有唤醒提示文字的拾音引导图像；其中，所述拾音引导图像用于提示所述用户语音识别功能已处于唤醒状态。 12.根据权利要求11所述的装置，其中，所述拾音引导图像中包括拾音符号；所述交互引导图像展示模块，具体用于：以预设动画效果向所述用户展示所述拾音引导图像中的拾音符号。 13.根据权利要求12所述的装置，其中，所述预设动画效果包括渐隐渐现动画效果。 14.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。 15.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。 16.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。

专利专题