一种语音信息的处理方法、装置、设备及介质

引用

摘要：

本发明公开了一种语音信息的处理方法、装置、设备及介质，用以解决现有智能语音交互过程时间长，导致效率低的问题。因为在本发明实施例中当最终语音数据的语音识别结果与语音结束点之前的语音截断点对应的临时语音识别结果相同时，将该语音结束点之前的语音截断点对应的临时语义识别结果直接作为最终语音数据的语义识别结果，从而节省了再对语音识别结果进行处理获取语义识别结果的时间，可直接将已获取的临时语义识别结果确定为最终语音数据的语义识别结果，完成本次交互，即可实现智能语音的交互，节省了基于最终语音数据的语音识别结果进行语义识别的处理过程，因此，缩短了对用户语音的响应时间，提高了整个智能语音交互的效率。

专利类型：发明专利

申请/专利号：CN202010366954.X

申请日期：2020-04-30

公开/公告号：CN111583933A

公开/公告日：2020-08-25

主分类号：G10L15/26(2006.01)

申请/专利权人:北京猎户星空科技有限公司

发明/设计人:李宝祥;钟贵平;李家魁

主申请人地址:100025 北京市朝阳区姚家园南路一号惠通时代广场8号

专利代理机构:北京同达信恒知识产权代理有限公司

代理人:黄邃

国别省市代码:北京;11

权利要求：

1.一种语音信息的处理方法，其特征在于，所述方法包括：基于语音活动检测VAD模型，在采集到的声音数据中检测到语音起始点后，检测到语音截断点，确定所述语音起始点与所述语音截断点之间的临时语音数据的临时语音识别结果，并确定所述临时语音识别结果对应的临时语义识别结果；检测到语音截断点之后，在采集到的声音数据中检测到语音结束点，确定所述语音起始点与所述语音结束点之间的最终语音数据的语音识别结果；若所述语音识别结果与所述语音结束点之前的语音截断点对应的临时语音识别结果相同，将所述语音结束点之前的语音截断点对应的临时语义识别结果确定为所述最终语音数据的语义识别结果。 2.根据权利要求1所述的方法，其特征在于，确定所述临时语音识别结果之后，所述方法还包括：若所述临时语音识别结果与缓存的临时语音识别结果不一致，根据所述临时语音识别结果，对缓存的临时语音识别结果进行更新；其中，缓存的临时语音识别结果为上一次检测到的语音截断点对应的临时语音数据的语音识别结果。 3.根据权利要求2所述的方法，其特征在于，若所述临时语音识别结果与缓存的临时语音识别结果不一致，所述方法还包括：根据所述临时语义识别结果，对缓存的临时语义识别结果进行更新；其中，缓存的临时语义识别结果为上一次检测到的语音截断点对应的临时语音数据的语义识别结果。 4.根据权利要求2所述的方法，其特征在于，所述方法还包括：根据所述临时语音识别结果或所述语音识别结果，控制智能设备更新所述智能设备显示的文本信息。 5.根据权利要求1所述的方法，其特征在于，所述检测到语音截断点，包括：若识别到连续静音帧的数量在预设数量范围内，则将所述连续静音帧中的设定时间点确定为所述语音截断点；或，若识别到连续静音帧的时长在预设时长范围内，则将所述连续静音帧中的设定时间点确定为所述语音截断点。 6.根据权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：若所述语音识别结果与所述语音结束点之前的语音截断点对应的临时语音识别结果不相同，确定所述语音识别结果对应的语义识别结果，将所述语义识别结果确定为所述最终语音数据的语义识别结果。 7.一种语音信息的处理装置，其特征在于，所述装置包括：第一确定单元，用于基于语音活动检测VAD模型，在采集到的声音数据中检测到语音起始点后，检测到语音截断点，确定所述语音起始点与所述语音截断点之间的临时语音数据的临时语音识别结果，并确定所述临时语音识别结果对应的临时语义识别结果；第二确定单元，用于检测到语音截断点之后，在采集到的声音数据中检测到语音结束点，确定所述语音起始点与所述语音结束点之间的最终语音数据的语音识别结果；处理单元，用于若所述语音识别结果与所述语音结束点之前的语音截断点对应的临时语音识别结果相同，将所述语音结束点之前的语音截断点对应的临时语义识别结果确定为所述最终语音数据的语义识别结果。 8.根据权利要求7所述的装置，其特征在于，所述第一确定单元，具体用于：确定所述临时语音识别结果之后，若所述临时语音识别结果与缓存的临时语音识别结果不一致，根据所述临时语音识别结果，对缓存的临时语音识别结果进行更新；其中，缓存的临时语音识别结果为上一次检测到的语音截断点对应的临时语音数据的语音识别结果。 9.一种电子设备，其特征在于，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-6中任一所述语音信息的处理方法的步骤。 10.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-6中任一所述语音信息的处理方法的步骤。

专利专题