关键词检测方法及装置
提供一种关键词检测方法及装置。所述方法包括:接收用户输入的语音信号;提取所述语音信号的语音特征;将所述语音特征和预设关键词的抽象表征序列输入到端到端的关键词检测模型,并得到所述关键词检测模型输出的所述语音信号中是否存在所述预设关键词的结果,其中,所述关键词检测模型通过下述方式来预测所述语音信号中是否存在所述预设关键词:基于所述语音特征和所述预设关键词的抽象表征序列,获取所述语音信号的抽象表征序列;基于所述语音信号的抽象表征序列,预测所述语音信号中所述预设关键词的位置信息;基于所述语音信号的抽象表征序列和所述位置信息,预测所述语音信号中是否存在所述预设关键词。
发明专利
CN202110291276.X
2021-03-18
CN113035231A
2021-06-25
G10L25/24(2013.01)
三星(中国)半导体有限公司
魏博;杨美蓉;张涛;唐晓;黄星
710000 陕西省西安市高新区洨河北路1999号
北京铭硕知识产权代理有限公司
徐璐璐%郭鸿禧
陕西;61
1.一种关键词检测方法,其中,所述方法包括: 接收用户输入的语音信号; 提取所述语音信号的语音特征; 将所述语音特征和预设关键词的抽象表征序列输入到端到端的关键词检测模型,并得到所述关键词检测模型输出的所述语音信号中是否存在所述预设关键词的结果, 其中,所述关键词检测模型通过下述方式来预测所述语音信号中是否存在所述预设关键词: 基于所述语音特征和所述预设关键词的抽象表征序列,获取所述语音信号的抽象表征序列; 基于所述语音信号的抽象表征序列,预测所述语音信号中所述预设关键词的位置信息; 基于所述语音信号的抽象表征序列和所述位置信息,预测所述语音信号中是否存在所述预设关键词。 2.根据权利要求1所述的方法,其中,所述预设关键词包括用户自定义的关键词。 3.根据权利要求1所述的方法,其中,基于所述语音特征和所述预设关键词的抽象表征序列,获取所述语音信号的抽象表征序列的步骤包括: 通过注意力机制将所述语音特征和所述预设关键词的抽象表征序列进行结合,来获取所述语音信号的抽象表征序列。 4.根据权利要求1所述的方法,其中,基于所述语音信号的抽象表征序列和所述位置信息,预测所述语音信号中是否存在所述预设关键词的步骤包括: 基于所述语音信号的抽象表征序列和所述位置信息,确定所述语音信号之中所述预设关键词所在部分的抽象表征序列; 通过注意力机制将所述语音信号之中所述预设关键词所在部分的抽象表征序列和所述预设关键词的抽象表征序列进行结合,来预测所述语音信号中是否存在所述预设关键词。 5.根据权利要求3所述的方法,其中,所述关键词检测模型包括:语音编码器,所述语音编码器用于预测语音信号的抽象表征序列, 其中,所述语音编码器包括多个串联的子模块,每个子模块通过注意力机制将所述预设关键词的抽象表征序列注入所述语音信号的隐层抽象表征序列。 6.根据权利要求1所述的方法,其中,所述预设关键词的抽象表征序列是通过预先训练好的关键词编码器基于所述预设关键词的音素序列生成的。 7.根据权利要求1所述的方法,其中,所述关键词检测模型是通过多目标联合训练得到的, 其中,所述多目标包括:预测出语音信号对应的音素序列、预测出关键词在语音信号中的位置、以及预测出语音信号中是否存在关键词。 8.根据权利要求7所述的方法,其中,与预测出关键词在语音信号中的位置这一目标对应的目标损失函数为:基于注意力矩阵对角线模式的位置损失函数。 9.根据权利要求1所述的方法,其中,所述方法还包括: 当所述关键词检测模型输出的结果是:所述语音信号中存在所述预设关键词时,唤醒当前电子终端;或者,输出所述结果和所述位置信息。 10.一种关键词检测装置,其中,所述装置包括: 接收单元,接收用户输入的语音信号; 特征提取单元,提取所述语音信号的语音特征; 检测单元,将所述语音特征和预设关键词的抽象表征序列输入到端到端的关键词检测模型,并得到所述关键词检测模型输出的所述语音信号中是否存在所述预设关键词的结果, 其中,所述关键词检测模型通过下述方式来预测所述语音信号中是否存在所述预设关键词: 基于所述语音特征和所述预设关键词的抽象表征序列,获取所述语音信号的抽象表征序列; 基于所述语音信号的抽象表征序列,预测所述语音信号中所述预设关键词的位置信息; 基于所述语音信号的抽象表征序列和所述位置信息,预测所述语音信号中是否存在所述预设关键词。 11.一种存储有计算机程序的计算机可读存储介质,其中,当所述计算机程序被处理器执行时实现如权利要求1至9中的任意一项所述的关键词检测方法。 12.一种关键词检测装置,其中,所述装置包括: 处理器; 存储器,存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1至9中的任意一项所述的关键词检测方法。