10.13705/j.issn.1671-6833.2023.04.014
低资源少样本连续语音识别最新进展
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求.首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展.其次,在连续语音识别框架技术发展的基础上,重点阐述了生成对抗网络、自监督表示学习、深度强化学习和元学习等高级深度学习技术在解决少样本语音识别方面的最新发展,如 FGSM、wav2vec、AMS 等代表性方法.在此基础上,分析了目前该技术面临的互补有限、数据和任务不均衡与模型轻量化部署问题.最后,对低资源少样本连续语音识别进行了总结,提出未来少样本训练识别的研究方向可以朝着先验信息引入、假设空间约束条件设定等方向进一步研究.
低资源少样本、连续语音识别、生成对抗网络、自监督表示学习、深度强化学习、元学习
44
TN912.34
国家自然科学基金;河南省中原科技创新领军人才项目
2023-07-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
1-9