语音信号处理方法、设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音信号处理方法、设备及存储介质

引用
本申请实施例涉及语音信号处理方法、设备及存储介质。本申请实施例包括:获取待检测帧的音频特征;获取语音信号中所述待检测帧之前预设长度时间窗内的静音点占比;根据所述音频特征确定静音点占比阈值;根据所述静音点占比和所述静音点占比阈值判断所述待检测帧是否是尾点帧。本申请实施例能够利用预设长度时间窗内静音点占比,并使用当前待检测帧的倒频谱特征来动态调节静音点占比阈值,从而克服了固定静音点占比阈值存在的语音尾点检测不准确的问题,有效提高了尾点帧检测的准确性和实时性。

发明专利

CN202010581908.1

2020-06-23

CN111768800A

2020-10-13

G10L25/03(2013.01)

中兴通讯股份有限公司

曹刚

518057 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦

广州嘉权专利商标事务所有限公司

洪铭福

广东;44

1.一种语音信号处理方法,其特征在于,包括: 获取语音信号中待检测帧的音频特征; 获取所述待检测帧之前预设长度时间窗内的静音点占比; 根据所述音频特征确定静音点占比阈值; 根据所述静音点占比和所述静音点占比阈值,确定所述语音信号中的尾点帧。 2.根据权利要求1所述的方法,其特征在于,所述音频特征为倒频谱特征。 3.根据权利要求2所述的方法,其特征在于,所述倒频谱特征包括以下的一种或多种: 所述待检测帧的零维倒谱C0及所述待检测帧的峰值位置t0。 4.根据权利要求3所述的方法,其特征在于,当所述倒频谱特征包括所述待检测帧的零维倒谱C0; 所述根据音频特征得到所述静音点占比阈值,包括: 根据第一阈值调节参数和第二阈值调节参数的比值,计算得到静音点占比阈值;其中,所述第一阈值调节参数与所述零维倒谱C0正相关。 5.根据权利要求3所述的方法,其特征在于,所述倒频谱特征包括所述待检测帧的峰值位置t0; 所述根据音频特征得到所述静音点占比阈值,包括: 根据第一阈值调节参数和第二阈值调节参数的比值,计算得到静音点占比阈值; 其中,所述第二阈值调节参数与所述峰值位置t0正相关。 6.根据权利要求3所述的方法,其特征在于,还包括: 所述倒频谱特征包括所述待检测帧的零维倒谱C0和所述待检测帧的峰值位置t0; 所述根据音频特征得到所述静音点占比阈值,包括: 根据第一阈值调节参数和第二阈值调节参数的比值,计算得到静音点占比阈值;其中,所述第一阈值调节参数与所述零维倒谱C0正相关;以及,所述第二阈值调节参数与所述峰值位置t0正相关。 7.根据权利要求1所述的方法,其特征在于,所述预设长度时间窗为40-80个帧长度的时间窗,所述帧长度为20-30ms。 8.根据权利要求1至7任一项所述的方法,其特征在于,所述根据所述静音点占比和所述静音点占比阈值,确定所述语音信号中的尾点帧,包括: 当静音点占比大于所述静音点占比阈值,确定所述待检测帧为尾点帧; 否则,继续获取待检测帧的下一个语音帧作为待检测帧进行检测,直至静音点占比大于所述静音点占比阈值,确定待检测帧为尾点帧。 9.根据权利要求1至7任一项所述的方法,其特征在于,还包括: 获取所述尾点帧之前的语音流数据; 识别所述语音流数据并输出响应信息。 10.一种电子设备,其特征在于,包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现: 如权利要求1至7任一项所述的语音信号处理方法。 11.一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行: 如权利要求1至7中任一项所述的语音信号处理方法。
相关文献
评论
法律状态详情>>
2020-10-13公开
相关作者
相关机构