模型互补的汉语韵律间断识别系统及方法

引用

摘要：

本发明公开了一种模型互补的汉语韵律间断识别方法及系统。由第一输入模块输入汉语语音、汉语文本、汉语语音中每一个汉字的切分边界；由分词、词性标注模块对输入的汉语文本进行分词和词性标注，并由第一词典、语法特征计算模块计算得到汉语文本中每一个汉字的词典特征和语法特征；由第一声学特征计算模块利用基频提取、音强计算模块对输入的汉语语音进行基频抽取、音强计算，得到汉语文本中每一个汉字的声学特征；加载已经训练好的组合互补模型，利用输入汉字的声学特征以及词典特征和语法特征进行识别、判断每一个汉字的韵律间断类型，输出已经标注好韵律间断类型的汉语文本。

专利类型：发明专利

申请/专利号：CN201210525876.9

申请日期：2012-12-07

公开/公告号：CN103035241A

公开/公告日：2013-04-10

主分类号：G10L15/187(2013.01)I

申请/专利权人:中国科学院自动化研究所

发明/设计人:刘文举;倪崇嘉

主申请人地址:100190 北京市海淀区中关村东路95号

专利代理机构:中科专利商标代理有限责任公司 11021

代理人:宋焰琴

国别省市代码:北京;11

权利要求：

一种模型互补的汉语韵律间断识别方法，包括组合互补模型的训练步骤A和利用组合互补模型对汉语韵律间断识别步骤B；??步骤A：组合互补模型训练模块对汉字的声学特征、词典特征以及语法特征利用集成分类回归树方法训练集成分类回归树模型，同时对汉字的声学特征、词典特征以及语法特征利用条件随机场方法训练条件随机场模型，并利用加权组合的方法对训练好的集成分类回归树模型和条件随机场模型进行加权组合，得到训练好的组合互补模型；??步骤B：根据所述组合互补模型进行汉语韵律间断识别。??

专利专题