基于二进时频单元的自动声音识别
本发明公开了一种自动声音识别方法,包括:提供包括多个模型的培训数据库,每一模型表示下述形式的声音元素:包括二进时频单元的二进掩模,二进时频单元指示所涉及声音元素的高能时间和频率区域;或从二进掩模提取的特性特征或统计量;提供包括输入声音元素的输入信号;基于培训数据库的模型估计输入声音元素以提供输出声音元素。本发明具有相对简单及可适应所涉及应用的优点。本发明可用在包括自动声音识别如装置的声音控制的装置中或用在听音装置如助听器中以改善语音可懂度。
发明专利
CN201010262636.5
2010-08-24
CN101996630A
2011-03-30
G10L15/06(2006.01)I
奥迪康有限公司
M·S·彼德森
丹麦斯门乌姆
北京金信立方知识产权代理有限公司 11225
黄威
丹麦;DK
自动声音识别方法,包括:?提供包括多个模型的培训数据库,每一模型表示下述形式的声音元素:■包括二进时频单元的二进掩模,二进时频单元指示所涉及声音元素的高能时间和频率区域;或■从二进掩模提取的特性特征或统计量;?提供包括输入声音元素的输入信号;?基于培训数据库的模型估计输入声音元素以提供输出声音元素。