收音控制方法、装置、电子设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

收音控制方法、装置、电子设备及存储介质

引用
本发明提出一种收音控制方法、装置及存储介质,在传统的人机对话系统中引入信息交互单元,该信息交互单元既支持与其它单元建立基于MRCP协议的连接,又支持与其它单元建立基于HTTP协议的连接,通过该信息交互单元与控制交互单元和视频合成单元间建立交互连接,在得知视频合成单元完成音视频流合成工作后,及时将该消息发送至控制交互单元,控制交互单元继而通知ASR单元开启语音识别,从而能够准确完整地对用户的回答进行语音识别,解决了传统人机对话系统中的ASR单元对合成的音视频流中的语音进行识别和遗漏用户回答声音的问题。

发明专利

CN202011564834.7

2020-12-25

CN112735427A

2021-04-30

G10L15/26(2006.01)

平安普惠企业管理有限公司

余强

518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

北京鸿元知识产权代理有限公司

李平%杨桦

广东;44

1.一种收音控制方法,应用于人机对话系统中,其特征在于,所述方法包括: 在控制交互单元和视频合成单元之间建立一信息交互单元;其中,所述信息交互单元通过所述控制交互单元支持的第一通信协议和所述控制交互单元进行交互连接,所述信息交互单元通过所述视频合成单元支持的第二通信协议和所述视频合成单元进行交互连接; 通过所述控制交互单元向所述视频合成单元发送开始合成音视频流的第一指令;以及, 通过所述控制交互单元向所述信息交互单元发送所述视频合成单元已开始合成音视频流的第二指令,其中,所述第二指令包括所述视频合成单元开始的合成音视频流的标识信息; 在所述视频合成单元根据所述第一指令完成音视频流的合成后,通过所述信息交互单元将所述视频合成单元发出的基于所述音视频流的合成完毕的信息的第三指令传递给所述控制交互单元; 根据所述第三指令,通过所述控制交互单元控制ASR单元进行语音识别。 2.如权利要求1所述的收音控制方法,其特征在于,在通过所述控制交互单元向所述视频合成单元发送开始合成音视频流的第一指令前,还包括: 在所述控制交互单元与所述视频合成单元之间建立基于HTTP协议和RTSP协议的交互连接;并且, 所述第一指令包括:人机对话的编号、人机对话的轮次和待合成音视频流的文本。 3.如权利要求2所述的收音控制方法,其特征在于, 所述第一通信协议包括MRCP协议和SIP协议;并且, 所述第二指令包括:人机对话的编号、人机对话的轮次、视频合成单元的编号和音视频流合成开始的信息。 4.如权利要求3所述的收音控制方法,其特征在于,所述第二通信协议为HTTP协议;并且, 所述第三指令包括:人机对话的编号、人机对话的轮次、视频合成单元的编号和音视频流合成完毕的信息。 5.如权利要求4所述的收音控制方法,其特征在于,在通过所述信息交互单元将所述视频合成单元发出的基于所述完成音视频流的合成的信息的第三指令传送给所述控制交互单元后,断开所述控制交互单元与所述信息交互单元间的交互连接。 6.如权利要求5所述的收音控制方法,其特征在于,在根据所述第三指令,通过所述控制交互单元向ASR单元发送开启语音识别的指令前,还包括: 基于MRCP协议和SIP协议建立所述控制交互单元与所述ASR单元之间的交互连接。 7.如权利要求6所述的收音控制方法,其特征在于,通过MRCP中控单元建立所述控制交互单元与所述ASR单元之间的交互连接。 8.一种收音控制装置,其特征在于,所述装置包括: 信息交互单元创建模块,用于在控制交互单元和视频合成单元之间建立一信息交互单元;其中,所述信息交互单元通过所述控制交互单元支持的第一通信协议和所述控制交互单元进行交互连接,所述信息交互单元通过所述视频合成单元支持的第二通信协议和所述视频合成单元进行交互连接; 收音控制启动模块,用于通过所述控制交互单元向所述视频合成单元发送开始合成音视频流的第一指令;以及,通过所述控制交互单元向所述信息交互单元发送所述视频合成单元已开始合成音视频流的第二指令,其中,所述第二指令包括所述视频合成单元开始的合成音视频流的标识信息; 收音控制完成模块,用于在所述视频合成单元根据所述第一指令完成音视频流的合成后,通过所述信息交互单元将所述视频合成单元发出的基于所述完成音视频流的合成的信息的第三指令传送给所述控制交互单元; 语音识别模块,用于根据所述第三指令,通过所述控制交互单元控制ASR单元进行语音识别。 9.一种电子设备,其特征在于,该电子设备包括:存储器及处理器,所述存储器中存储有收音控制程序,所述收音控制程序被所述处理器执行时实现如权利要求1至7中任一项所述的收音控制方法的步骤。 10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有收音控制程序,所述收音控制程序被处理器执行时,实现如权利要求1至7中任一项权利要求所述的收音控制方法的步骤。
相关文献
评论
法律状态详情>>
2021-04-30公开
相关作者
相关机构