英语语音合成中基于有限泛化法的字素切分规则的机器学习
在英语语音合成中,由于英语有着几乎无限多的词汇,因此不可能创建包含所有词汇的词库.对于未包含在词库中的英语单词,通过"字母转换成音素(L2P)"算法自动生成其音标是一个最好的解决办法.而L2P首要的任务就是字素切分.为此,文中提出了一种有限泛化法(FGA)的机器学习算法,用于进行字素切分规则学习.用于学习的词典库有27040个单词,其中90%的词用于规则学习,剩下的10%用于测试.经过10轮交叉验证,学习实例和测试实例的平均实例切分正确率为99.84%和97.88%,平均单词切分正确率为99.72%和96.35%;平均规则数为472个.
语音合成、字母转换成音素(L2P)、机器学习、有限泛化
25
TP391(计算技术、计算机技术)
2005-09-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
2010-2014