一种基于声纹的语音识别方法

引用

摘要：

本发明公开了一种基于声纹的语音识别方法，该方法包括以下步骤：S1、获取环境中多个不同位置的音频信息；S2、根据所述多个音频信息中的声纹特征分离出个体声音，将所述个体声音分组并记录时间信息，将各分组中的个体声音进行融合得到个体增强音频信息；S3、根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频信息对个体定位；S4、根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组；S5、显示和播放讨论分组中的个体增强音频信息。

专利类型：发明专利

申请/专利号：CN202110124834.3

申请日期：2021-01-29

公开/公告号：CN112885356A

公开/公告日：2021-06-01

主分类号：G10L17/00(2013.01)

申请/专利权人:焦作大学

发明/设计人:张喜云;李振新;霍霄艳;闫晶;韩娟娟;赵雷;王康

主申请人地址:454000 河南省焦作市山阳区人民路东段3066号

专利代理机构:成都其高专利代理事务所(特殊普通合伙)

代理人:廖曾

国别省市代码:河南;41

权利要求：

1.一种基于声纹的语音识别方法，其特征在于，该方法包括如下步骤： S1、获取环境中多个不同位置的音频信息； S2、根据所述多个音频信息中的声纹特征分离出个体声音，将所述个体声音分组并记录时间信息，将各分组中的个体声音进行融合得到个体增强音频信息； S3、根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频信息对个体定位； S4、根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组； S5、显示和播放讨论分组中的个体增强音频信息。 2.根据权利要求1和2所述的基于声纹的语音识别方法，其特征在于，所述步骤S2中的分离出个体声音的方法为：预先采集个体声音信息，存储并进行语音建模为分离模型。 3.根据权利要求1所述的基于声纹的语音识别方法，其特征在于，所述步骤S2中的个体声音分组是指将分离出的多个个体声音进行分组并赋予时间标签。 4.根据权利要求1所述的基于声纹的语音识别方法，其特征在于，所述步骤S2中的个体声音融合方法为将各个分组中的相同个体声音根据频谱信息进行融合。 5.根据权利要求1所述的基于声纹的语音识别方法，其特征在于，所述步骤S3中的个体位置定位方法根据接收到的个体声音的飞行时间计算得到。 6.根据权利要求2所述的基于声纹的语音识别方法，其特征在于，根据个体声音与分离模型进行比较进行相似度运算以实现个体声音分辨，然后将个体声音从环境音中提取出来。

专利专题