基于声学相关特征与词典语法相关特征的汉语重音检测

引用

摘要：

重音对提高语音合成系统的自然度、可懂度以及语音识别系统的正确率等方面扮演着非常重要的作用.该文基于大规模韵律标注的语料库,利用声学相关特征及词典语法相关特征对汉语重音进行检测.采用Boosting 集成分类回归树对当前音节的声学相关特征以及词典语法相关特征进行建模,Boosting集成分类回归树充分利用了当前音节的特性.同时还对词典语法相关特征采用条件随机场方法建模,条件随机场很好地利用了当前音节的上下文特性.最后,将Boosting集成分类回归树模型和条件随机场模型加权组合获得识别率更高的混合模型.该混合模型克服了Boosting集成分类回归树模型的不足,实现了Boosting集成分类回归树和条件随机场的优势互补.实验结果表明该方法具有较好的分类效果,在ASCCD语料库上能够获得84.82％重音检测正确率.同时,与之前其他人的工作在相同的条件下(相同的训练集和测试集)对比,在正确率方面,该方法分别有4.01％和1.67％的提高.另外,该文中,对英语的重音检测和汉语的重音检测做了对比,并通过特征分析方法从另一个层面验证了一些语言学上的结论.

关键词：重音、Boosting集成分类回归树、条件随机场、神经网络、分类回归树

所属期刊栏目：34

分类号：TP319(计算技术、计算机技术)

资助基金：国家自然科学基金90820303,60675026,90820011;国家“八六三”高技术研究发展计划项目基金20060101Z4073,2006 AA01 Z194;国家“九七三”重点基础研究发展规划项目基金2004CB318105

在线出版日期：2012-01-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：1638-1649

英文信息展示

期刊专题