10.13296/j.1001-1609.hva.2023.11.005
面向变电站智能运检的声音谱特征语音识别方法
语音识别是变电站智能运检中关键的人机交互技术.然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限.为此,文中提出了一种基于声音谱特征的语音识别方法.通过融合MFCC与CQT谱,形成一种基于声音谱的特征参数,通过对参数分布的估计,能够有效地降低语音信息中的噪声干扰.为提升语音识别性能,文中设计一个端到端的语音识别模型.该模型基于卷积神经网络(CNN),并融合了CTC和注意力机制.CNN网络能够有效地捕捉语音数据中的局部模式和结构信息,而CTC和注意力机制在解码过程中起到关键作用.文中使用Aurora、Aishell以及运检语音数据集进行了实验评估,比较了语音降噪、语音识别同传统方法的效果.实验结果表明,所提出的语音识别模型取得了显著的性能提升,可为相关领域的研究和应用提供有价值的参考.
智能运检、语音识别、声音谱特性、分布估计、卷积神经网络
59
TN912.34;TP391;TP18
2023-11-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
40-47