端到端唤醒词检测方法及装置
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

端到端唤醒词检测方法及装置

引用
本发明公开了一种端到端唤醒词检测方法及装置,所述方法包括:接收待检测语音;依次提取所述待检测语音中每个语音帧的声学特征;将提取的声学特征输入预先构建的声学模型,得到所述声学模型输出的每个语音帧中的目标发音单元的后验概率;将每个目标发音单元作为一个节点,并在所述目标发音单元前后插入虚拟静音节点,得到目标‑时间关系矩阵;逐帧计算所述目标‑时间关系矩阵中各节点的累积概率;根据所述矩阵中各节点的累积概率确定最优路径;根据所述最优路径确定唤醒词检测结果。利用本发明,可以提高检测结果的准确性,降低误唤醒率。

发明专利

CN201910067818.8

2019-01-24

CN111554271A

2020-08-18

G10L15/05(2013.01)

北京搜狗科技发展有限公司

解传栋;胡博;刘忠亮;唐文琦

100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

北京华圣典睿知识产权代理有限公司

赵景平

北京;11

1.一种端到端唤醒词检测方法,其特征在于,所述方法包括: 接收待检测语音; 依次提取所述待检测语音中每个语音帧的声学特征; 将提取的声学特征输入预先构建的声学模型,得到所述声学模型输出的每个语音帧中的目标发音单元的后验概率; 将每个目标发音单元作为一个节点,并在所述目标发音单元前后插入虚拟静音节点,根据所述目标发音单元的后验概率得到目标-时间关系矩阵; 逐帧计算所述目标-时间关系矩阵中各节点的累积概率; 根据所述矩阵中各节点的累积概率确定最优路径; 根据所述最优路径确定唤醒词检测结果。 2.根据权利要求1所述的方法,其特征在于,所述方法还包括按以下方式构建所述声学模型: 收集唤醒词数据和非唤醒词数据; 分别对所述唤醒词数据和非唤醒词数据进行时间标记,得到帧级别标签数据; 利用所述帧级别标签数据训练得到所述声学模型。 3.根据权利要求2所述的方法,其特征在于,所述分别对所述唤醒词数据和非唤醒词数据进行时间标记,得到帧级别标签数据包括: 确定唤醒词和非唤醒词的标签映射关系; 分别对所述唤醒词数据和非唤醒词数据进行对齐,得到所述唤醒词数据和非唤醒词数据中每个字与所述字占有的语音帧的对应关系; 根据所述标签映射关系及所述对应关系,分别将所述唤醒词数据和非唤醒词数据映射为标签形式,得到帧级别标签数据。 4.根据权利要求3所述的方法,其特征在于,所述确定唤醒词和非唤醒词的标签映射关系包括: 将所述唤醒词的开始时间段和结束时间段使用静音表示; 对于所述唤醒词中的每个字按照位置顺序设定所述字对应的标签; 对于静音和唤醒词之外的其它词或字,设定对应的标签为0。 5.根据权利要求1所述的方法,其特征在于,所述逐帧计算所述目标-时间关系矩阵中各节点的累积概率包括: 确定能够到达所述节点之前所有路径中的最优路径累计概率; 将所述最优路径累计概率与所述节点的概率相加,得到所述节点的累积概率。 6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述最优路径确定唤醒词检测结果包括: 确定所述最优路径上各目标发音单元的起始位置和结束位置,根据所述累积概率及起始位置和结束位置计算所述目标发音单元的长度及平均概率; 根据所述最优路径上各目标发音单元的长度和/或平均概率确定是否满足设定条件; 如果是,则确定检测到唤醒词。 7.根据权利要求6所述的方法,其特征在于,所述设定条件包括: 在设定区间内各目标发音单元的长度均大于设定的长度阈值;和/或 在设定区间内各目标发音单元的平均概率均大于设定的平均概率阈值。 8.一种端到端唤醒词检测装置,其特征在于,所述装置包括: 接收模块,用于接收待检测语音; 特征提取模块,用于依次提取所述待检测语音中每个语音帧的声学特征; 声学检测模块,用于将提取的声学特征输入预先构建的声学模型,得到所述声学模型输出的每个语音帧中的目标发音单元的后验概率; 矩阵构建模块,用于将每个目标发音单元作为一个节点,并在所述目标发音单元前后插入虚拟静音节点,根据所述目标发音单元的后验概率得到目标-时间关系矩阵; 计算模块,用于逐帧计算所述目标-时间关系矩阵中各节点的累积概率; 最优路径确定模块,用于根据所述矩阵中各节点的累积概率确定最优路径; 检测模块,用于根据所述最优路径确定唤醒词检测结果。 9.一种计算机设备,其特征在于,包括:一个或多个处理器、存储器; 所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现如权利要求1至7任一项所述的方法。 10.一种可读存储介质,其上存储有指令,所述指令被执行以实现如权利要求1至7任一项所述的方法。
相关文献
评论
法律状态详情>>
2020-08-18公开
相关作者
相关机构