英语语音合成中基于有限泛化法的字素切分规则的机器学习

引用

摘要：

在英语语音合成中,由于英语有着几乎无限多的词汇,因此不可能创建包含所有词汇的词库.对于未包含在词库中的英语单词,通过"字母转换成音素(L2P)"算法自动生成其音标是一个最好的解决办法.而L2P首要的任务就是字素切分.为此,文中提出了一种有限泛化法(FGA)的机器学习算法,用于进行字素切分规则学习.用于学习的词典库有27040个单词,其中90%的词用于规则学习,剩下的10%用于测试.经过10轮交叉验证,学习实例和测试实例的平均实例切分正确率为99.84%和97.88%,平均单词切分正确率为99.72%和96.35%;平均规则数为472个.

关键词：语音合成、字母转换成音素(L2P)、机器学习、有限泛化

所属期刊栏目：25

分类号：TP391(计算技术、计算机技术)

在线出版日期：2005-09-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2010-2014

英文信息展示

期刊专题