10.16652/j.issn.1004⁃373x.2022.21.007
多通道PNCC与残差网络命令词识别系统
针对非用户语音和噪声干扰下命令词识别的准确率和稳健性问题,提出多通道麦克风阵列与功率归一化倒谱系数结合残差神经网络的命令词识别系统.首先,应用残差单元构建标准ResNet?CW?15多任务模型和低功耗ResNet?CW?6多任务模型,当模型判断命令词为用户发出后,开始执行命令词识别功能,若判断为非用户,则不执行命令词识别功能.其次,采用多通道麦克风阵列采集含有空域特征信息的语音命令词数据集.最后,应用对噪声具有一定鲁棒性的功率归一化倒谱系数作为命令词数据集的特征对网络进行训练.标准ResNet?CW?15模型在噪声条件下命令词识别率和用户/非用户判断性能表现良好.低功耗模型ResNet?CW?6虽然在整体命令词识别率和用户判断准确率有所降低,但网络参数大幅度减少,极大降低了系统的功耗,更适合广泛部署在小型低功耗智能设备.
命令词识别系统、多通道麦克风阵列、多任务模型、功率归一化倒谱系数、残差网络、低功耗、用户判断
45
TN911.7⁃34;TP391.4;TP181
国家自然科学基金;广西自然科学基金重点项目;广西无线宽带通信与信号处理重点实验室基金项目;教育部重点实验室基金;桂林电子科技大学研究生教育创新计划项目
2022-11-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
37-42