用于大规模语料库建设的一种 汉语语句切分方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.12045/j.issn.1007-3043.2019.08.015

用于大规模语料库建设的一种 汉语语句切分方法

引用
在语音识别和语音合成大规模语料库的构建中,需要把较长内容的语音文件切分成一定字数要求的语音数据文件和对应的文本文件.一种有效的自动切分方法是通过对单字占用时间的预测和元音主体数目的统计来评估切分点的位置,实现对语音数据的自动切分.实验表明,使用该方法进行切分的一次成功率可以达到92.8%,参数适当调整后的二次成功率为96.3%.整个切分过程中,进行人工调整的工作量很小,适合快速构建大规模语料库.

元音主体、切分、语音合成、能熵比法

TN912.3

北京市教育委员会科技计划KM201410857001

2019-09-04(万方平台首次上网日期,不代表论文的发表时间)

共4页

70-73

相关文献
评论
暂无封面信息
查看本期封面目录

邮电设计技术

1007-3043

10-1043/TN

2019,(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn