一种用于维吾尔语语音识别的识别单元的选择方法及系统
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种用于维吾尔语语音识别的识别单元的选择方法及系统

引用
本发明实施例涉及一种用于维吾尔语语音识别的词典单元的选择方法及系统。方法包括:为待识别的语音收集/准备相应的文本语料;从文本语料中抽取不同的词语;将所述不同词语输入形态分析器,分析成功时获得相应的词语的分解结果,分析失败时对所述词语进行基于削尾算法的词语分解,从而获得分解结果,以及根据所述分解结果,得到每个词语对应的词干以及附加成分;将所述文本语料中的词语映射为所述词干和附加成分,抽取高频词干和附加成分作为词典单元。本发明实施例根据维吾尔语形态变化的规则,将维吾尔语词语分解为词干和附加成分,然后选择词干和附件成分作为识别单元,从而缓解了识别系统集外词过多的问题,提高了系统的识别率。

发明专利

CN201210560599.5

2012-12-21

CN103065632A

2013-04-24

G10L15/28(2013.01)I

中国科学院声学研究所%北京中科信利技术有限公司

潘接林;李鑫;颜永红

100190 北京市海淀区北四环西路21号

北京亿腾知识产权代理事务所 11309

陈霁

北京;11

一种用于维吾尔语语音识别的词典单元的选择方法,其特征在于,所述方法包括:为待识别的语音准备相应的文本语料;从所述文本语料中抽取不同的词语;将所述不同词语输入形态分析器,在形态分析器分析成功时获得相应的词语的分解结果,在形态分析器分析失败时对所述词语进行基于削尾算法的词语分解,从而获得相应的分解结果,以及根据所述分解结果,得到每个词语对应的词干以及附加成分;将所述文本语料中的词语映射为所述词干和附加成分,抽取高频词干和附加成分作为词典单元。
相关文献
评论
法律状态详情>>
2013-04-24公开
2013-05-29实质审查的生效
2014-10-08授权
相关作者
相关机构