语音识别方法、装置及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音识别方法、装置及存储介质

引用
本公开涉及一种语音识别方法、装置及存储介质,以解决语音识别召回率较低的问题,包括:根据采集到的目标语音确定待查询实体;基于数据库的倒排索引查询待查询实体得到候选实体集;对待查询实体对应的汉字的拼音信息与候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到待查询实体对应的归一化拼音信息和每一候选实体的归一化拼音信息;将待查询实体的归一化拼音信息与每一候选实体的归一化拼音信息进行比对;若存在归一化拼音信息与待查询实体的归一化拼音信息一致的候选实体,则将该候选实体作为针对待查询实体的查询结果。这样,可以有效地提高语音识别的召回率,从而保证语音查询的全面性。

发明专利

CN202011242358.7

2020-11-09

CN112133295A

2020-12-25

G10L15/187(2013.01)

北京小米松果电子有限公司

陈亮;陈帅;彭力

100085 北京市海淀区西二旗中路33号院6号楼3层004号

北京英创嘉友知识产权代理事务所(普通合伙)

魏嘉熹

北京;11

1.一种语音识别方法,其特征在于,所述方法包括: 根据采集到的目标语音确定待查询实体; 基于数据库的倒排索引查询所述待查询实体,得到候选实体集; 对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到所述待查询实体对应的归一化拼音信息以及所述每一候选实体的归一化拼音信息,所述归一化处理用于统一所述拼音信息对平舌音和翘舌音、前鼻音和后鼻音、边音和鼻音、声母f和声母h中的一组或多组的表达方式; 将所述待查询实体的归一化拼音信息与所述每一候选实体的归一化拼音信息进行比对;并且, 若存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则将该候选实体作为针对所述待查询实体的查询结果。 2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 若不存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则确定候选实体的归一化拼音信息中是否存在包含和/或包含于待查询实体的归一化拼音信息的第二候选实体,其中,所述第二候选实体的归一化拼音信息与所述待查询实体的所述归一化拼音信息的文字长度差小于4; 若确定候选实体的归一化拼音信息中存在包含所述待查询实体的所述归一化拼音信息的第二候选实体,则将该第二候选实体作为针对所述待查询实体的查询结果。 3.根据权利要求2所述的方法,其特征在于,所述方法还包括: 若不存在候选实体的归一化拼音信息中包含所述待查询实体的所述归一化拼音信息的第二候选实体,则对所述待查询实体的归一化拼音信息进行单字拼音分割以及对所述每一候选实体的归一化拼音信息进行单字拼音分割; 将单字拼音分割后的所述待查询实体的所述归一化拼音信息进行单字拼音排列组合以及将单字拼音分割后的所述每一候选实体的归一化拼音信息进行单字拼音排列组合; 将单字拼音排列组合后的所述待查询实体的所述归一化拼音信息与单字拼音排列组合后的所述每一候选实体的归一化拼音信息进行比对;并且, 若存在单字拼音排列组合后的归一化拼音信息与单字拼音分割后的所述待查询实体的所述归一化拼音信息一致的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果。 4.根据权利要求3所述的方法,其特征在于,所述若存在单字拼音排列组合后的归一化拼音信息与单字拼音分割后的所述待查询实体的所述归一化拼音信息一致的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果包括: 对所述单字拼音排列组合后的所述待查询实体的所述归一化拼音信息进行分词处理,得到待查询分词元素,以及对所述单字拼音排列组合后的所述每一候选实体的归一化拼音信息进行分词处理,得到对应的实体候选分词元素; 对所述待查询分词元素进行排列组合,得到待查询组合语句,并由所述待查询组合语句构成待查询拼音列表,以及对所述每一候选实体对应的实体候选分词元素进行排列组合,得到对应的候选实体组合语句,并由对应的所述候选实体组合语句构成对应的候选实体拼音列表; 确定所述待查询拼音列表与每一所述候选实体拼音列表的长度关系以及匹配值,并确定所述待查询拼音列表与所述候选实体拼音列表的长度较短的拼音列表为第一列表; 确定每一所述匹配值与对应的第一列表的长度之间的比值;并且, 若存在比值大于预设阈值的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果。 5.根据权利要求4所述的方法,其特征在于,所述确定所述待查询拼音列表与每一所述候选实体拼音列表的匹配值包括: 遍历确定每一所述待查询组合语句的第一个分词元素拼音开头与每一所述候选实体组合语句的拼音开头是否一致; 若确定待查询组合语句的第一个分词元素拼音开头与候选实体组合语句的拼音开头一致,则增大所述待查询拼音列表与对应的该候选实体拼音列表的匹配值。 6.根据权利要求1所述的方法,其特征在于,所述对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,包括: 在所述待查询实体的每一汉字对应的汉字拼音前添加位置标记符,并在所述待查询实体的最后一个汉字对应的汉字拼音的韵母后添加位置标记符;以及, 在所述每一候选实体的每一汉字对应的汉字拼音前添加位置标记符,并在所述每一候选实体的最后一个汉字的汉字拼音的韵母后添加位置标记符; 基于所述位置标记符对所述待查询实体对应的汉字的拼音信息以及所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理。 7.根据权利要求1~6任一项所述的方法,其特征在于,所述基于数据库的倒排索引查询所述待查询实体,得到候选实体集包括: 根据所述待查询实体对应的汉字信息,基于倒排索引从所述数据库中查询所述汉字信息对应的汉字语句,并基于TF-IDF算法打分排序取分数在前的第一预设数量个第一汉字语句;以及, 根据所述待查询实体对应的拼音信息,基于倒排索引从所述数据库中查询所述待查询实体对应的拼音语句,并基于TF-IDF算法打分排序取分数在前的第二预设数量个拼音语句,并根据所述拼音语句得到第二汉字语句; 根据所述第一汉字语句以及所述第二汉字语句取并集得到所述候选实体集; 其中,所述数据库是根据每一汉字与语句之间的对应关系建立倒排索引以及每一汉字的拼音与语句之间的对应关系建立倒排索引构建的。 8.一种语音识别装置,其特征在于,包括: 确定模块,被配置为根据采集到的目标语音确定待查询实体; 查询模块,被配置为基于数据库的倒排索引查询所述待查询实体,得到候选实体集; 处理模块,被配置为对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到所述待查询实体对应的归一化拼音信息以及所述每一候选实体的归一化拼音信息,所述归一化处理用于统一所述拼音信息对平舌音和翘舌音、前鼻音和后鼻音、边音和鼻音、声母f和声母h中的一组或多组的表达方式; 比对模块,被配置为将所述待查询实体的归一化拼音信息与所述每一候选实体的归一化拼音信息进行比对; 执行模块,被配置为若存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则将该候选实体作为针对所述待查询实体的查询结果。 9.一种语音识别装置,其特征在于,包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为: 根据采集到的目标语音确定待查询实体; 基于数据库的倒排索引查询所述待查询实体,得到候选实体集; 对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到所述待查询实体对应的归一化拼音信息以及所述每一候选实体的归一化拼音信息,所述归一化处理用于统一所述拼音信息对平舌音和翘舌音、前鼻音和后鼻音、边音和鼻音、声母f和声母h中的一组或多组的表达方式; 将所述待查询实体的归一化拼音信息与所述每一候选实体的归一化拼音信息进行比对;并且, 若存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则将该候选实体作为针对所述待查询实体的查询结果。 10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~7中任一项所述方法的步骤。
相关文献
评论
法律状态详情>>
2020-12-25公开
2020-12-25公开
相关作者
相关机构