基于二进时频单元的自动声音识别

引用

摘要：

本发明公开了一种自动声音识别方法，包括：提供包括多个模型的培训数据库，每一模型表示下述形式的声音元素：包括二进时频单元的二进掩模，二进时频单元指示所涉及声音元素的高能时间和频率区域；或从二进掩模提取的特性特征或统计量；提供包括输入声音元素的输入信号；基于培训数据库的模型估计输入声音元素以提供输出声音元素。本发明具有相对简单及可适应所涉及应用的优点。本发明可用在包括自动声音识别如装置的声音控制的装置中或用在听音装置如助听器中以改善语音可懂度。

专利类型：发明专利

申请/专利号：CN201010262636.5

申请日期：2010-08-24

公开/公告号：CN101996630A

公开/公告日：2011-03-30

主分类号：G10L15/06(2006.01)I

申请/专利权人:奥迪康有限公司

发明/设计人:M·S·彼德森

主申请人地址:丹麦斯门乌姆

专利代理机构:北京金信立方知识产权代理有限公司 11225

代理人:黄威

国别省市代码:丹麦;DK

权利要求：

自动声音识别方法，包括：?提供包括多个模型的培训数据库，每一模型表示下述形式的声音元素：■包括二进时频单元的二进掩模，二进时频单元指示所涉及声音元素的高能时间和频率区域；或■从二进掩模提取的特性特征或统计量；?提供包括输入声音元素的输入信号；?基于培训数据库的模型估计输入声音元素以提供输出声音元素。

专利专题