10.11772/j.issn.1001-9081.2017092149
基于TensorFlow的俄语词汇标音系统
针对俄语语音合成和语音识别系统中发音词典规模有限的问题,提出一种基于长短时记忆(LSTM)序列到序列模型的俄语词汇标音算法,同时设计实现了标音原型系统.首先,对基于SAMPA的俄语音素集进行了改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象,并依据改进的新音素集构建了包含20000词的俄语发音词典;然后利用TensorFlow框架实现了这一算法,该算法通过编码LSTM将俄语单词转换为固定维数的向量,再通过解码LSTM将向量转换为目标发音序列;最后,设计实现了具有交互式单词标音等功能的俄语词汇标音系统.实验结果表明,该算法在集外词测试集上的词形正确率达到了74.8%,音素正确率达到了94.5%,均高于Phonetisaurus方法.该系统能够有效为俄语发音词典的构建提供支持.
俄语、词汇标音、长短时记忆网络、序列到序列、TensorFlow
38
TP391.1(计算技术、计算机技术)
洛阳市社会科学规划项目2016B285.This work is partially supported by the Project of Social Science Planning of Luoyang 2016B285
2018-06-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
971-977