一种基于人工智能算法的语音识别系统
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种基于人工智能算法的语音识别系统

引用
本发明提供一种基于人工智能算法的语音识别系统。所述基于人工智能算法的语音识别系统包括用户界面,所述用户界面用于显示内容;语音接收模块,所述语音接收模块用于接收语音信号;语音识别模块,所述语音识别模块用于将所述语音信号进行识别;对比模块,所述对比模块用于检测解码结果的准确率;摄像模块,所述摄像模块用于提供用户的图像信号;意图判断模块,所述意图判断模块针对所述摄像模块所拍摄的图像信号和所识别出的发声,判断所述用户有无操作所述被控制装置的意图。本发明提供的基于人工智能算法的语音识别系统具有识别准确率高、可对用户操作意识进行判断的优点。

发明专利

CN202110268134.1

2021-03-11

CN113035197A

2021-06-25

G10L15/22(2006.01)

上海佑译信息科技有限公司

杜金林

200000 上海市宝山区逸仙路2816号B栋20F

上海大为知卫知识产权代理事务所(普通合伙)

何银南

上海;31

1.一种基于人工智能算法的语音识别系统,其特征在于,包括: 用户界面,所述用户界面用于显示内容; 语音接收模块,所述语音接收模块用于接收语音信号; 语音识别模块,所述语音识别模块用于将所述语音信号进行识别,所述语音识别模块包括: 信号转换模块、特征提取模块、编码模块、密码本模块和运算解码模块; 所述信号转换模块用于将所述语音信号转换为数字信号; 所述特征提取模块用于对所述数字信号进行分帧处理,提取每一帧所述数字信号的特征参数,得到特征矢量序列; 编码模块用于将所述特征适量序列转换为特征码字序列; 密码本模块储存有每个码字对应的密码本中的密码字的概率值; 解码运算模块用于对该特征码字序列进行解码运算得到识别结果,运算中对该特征码字序列中的各个码字,从密码本模块中直接查找与其具有最大匹配概率的密码字,得到解码结果; 对比模块,所述对比模块用于检测解码结果的准确率; 摄像模块,所述摄像模块用于提供用户的图像信号; 意图判断模块,所述意图判断模块针对所述摄像模块所拍摄的图像信号和所识别出的发声,判断所述用户有无操作所述被控制装置的意图。 2.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述密码本为高斯码本。 3.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述编码模块根据将特征矢量序列转换为特征码字序列的步骤如下: S1:将所述特征矢量序列划分为多个子空间,每一个所述子空间对应于一个码本; S2:计算各子空间中所有特征矢量与相应码本中的各码字之间的距离度量,将与该特征矢量具有最小距离度量的码字作为所述特征码字序列中对应该特征矢量的码字; S3:将所述特征矢量序列各个子空间所有矢量所对应的码字按原矢量顺序组合起来,即得到对应的特征码字序列。 4.根据权利要求2所述的基于人工智能算法的语音识别系统,其特征在于,所述密码本模块通过以下步骤生成的: L1:计算高斯码本中各码字对应的均值和方差矢量; L2:利用上述均值和方差矢量,计算所述特征码本中各个码字与高斯码本中:各个码字相匹配的对数概率值; L3:将特征码本中的所有码字与高斯码本中的所有码字相匹配的概率值储存起来即可得到密码本模块。 5.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述对比模块中储存多条常用特定句子文本,所述对比模块将语音识别模块识别的结果与特定句子文本进行对比,判断语音识别模块识别的准确率。 6.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述摄像模块重点标识用户的眼睛关注点和嘴唇移动。 7.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述意图判断模块在判断为有操作意图的情况下,对表示该操作的意图达到何种程度的可靠度进行判断。 8.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,还包括控制状态变更模块,所述控制状态变更模块在所述意图判断部中判断为无操作意图的情况下,与判断为有操作意图的情况相比,将所述被控制装置的控制的状态向不让所述用户意识到的方向进行变更。 9.根据权利要求8所述的基于人工智能算法的语音识别系统,其特征在于,所述控制状态变更模块在所述意图判断模块中判断出的可靠度较低的情况下,与可靠度较高的情况相比,将被控制装置的控制的状态向不让所述用户意识到的方向进行变更。 10.根据权利要求8所述的基于人工智能算法的语音识别系统,其特征在于,所述控制状态变更模块在用户所发出的语音的识别失败的情况下,对所述被控制装置进行控制,使所述被控制装置向所述用户通知识别失败,并在关于发声的操作意图的可靠度较低的情况下,与可靠度较高的情况相比,将该通知的状态向不让所述用户意识到的方向进行变更。
相关文献
评论
法律状态详情>>
2021-06-25公开
相关作者
相关机构