多语言语音识别声学模型建模方法最新进展

引用

摘要：

随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多.语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈.文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难.并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果.最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术.

关键词：多语言;语音识别;声学模型

所属期刊栏目：49

分类号：TP391(计算技术、计算机技术)

在线出版日期：2022-01-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：47-52

英文信息展示

期刊专题