10.16208/j.issn1000-7024.2018.12.037
深度迁移模型下的小样本声纹识别方法
基于神经网络的生物特征识别通常需要大量训练样本,目标数据集不足使得神经网络难以获得实际应用.在小样本声纹识别中,为提高识别的准确率,结合卷积神经网络与迁移学习提出一种基于小样本的说话人识别方法.在卷积过程中引入快速批量归一化(fast batch normalization,FBN),提高深度神经网络收敛速度.将预训练模型中的全连接层改为RBM(restricted Boltzmann machine),用小样本声纹训练RBM和分类器,RBM能够进一步学习小样本声纹特有的高阶特征,消除在迁移过程中声纹数据集间的差异.选取包含400人的AISHELI-ASR0009-OS1语音数据库及实验室自采的20人语音库进行实验,实验结果表明,融合FBN的神经网络相比原始网络的训练时间减少了35.6%,最优方法相比其它两种方法识别率提高了9.7%-41.3%,验证了所提方法的可行性和有效性.
声纹识别、受限玻尔兹曼机、卷积神经网络、快速批量归一化、迁移学习、小样本
39
TN912.34
国家自然科学基金项目61272147;长江大学青年基金项目2016cqn10;大学生创新创业训练计划基金项目2017009
2019-03-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
3816-3822