10.3969/j.issn.1006-9348.2023.01.045
基于At-LSTM模型的音/视频双流语音识别算法仿真
语音中的噪声会影响语音信号中的正常信息,影响语音识别效果,为提升音/视频双流语音识别准确率与效率,提出基于注意力LSTM的音/视频双流语音识别算法.使用小波阈值方法对音/视频双流语音数据实施去噪处理,依据去噪结果对语音数据矢量量化;基于语音数据量化结果构建At-LSTM模型,运用该模型提取语音数据的局部与整体特征,并融合处理特征;基于语音数据特征融合结果,对语音数据实施分类,实现音/视频双流语音的识别.实验结果表明,使用上述方法识别音/视频双流语音时,识别准确率高、识别时间短,且语音中的含噪部分较少,识别的语音更加流畅.
注意力机制、音/视频、双流语音识别、语音数据去噪
40
TP391(计算技术、计算机技术)
2023-03-01(万方平台首次上网日期,不代表论文的发表时间)
共5页
251-254,282