提取语音信号的韵律特征的方法和装置
本发明公开了一种提取语音信号的韵律特征的方法和装置,其中该方法包括:对语音信号进行分帧;对语音帧进行时域到频域的变换;以及针对不同的频段,提取相应的韵律特征。根据本发明的上述技术方案,可以有效地提取能够与传统声学特征无障碍结合的韵律特征。
发明专利
CN200910168513.2
2009-08-21
CN101996628A
2011-03-30
G10L15/02(2006.01)I
索尼株式会社
刘昆;吴伟国
日本东京都
北京集佳知识产权代理有限公司 11227
朱胜%陈炜
日本;JP
一种提取语音信号的韵律特征的方法,包括:对语音信号进行分帧;对语音帧进行时域到频域的变换;针对不同的频段,计算相应的韵律特征;以及其中,针对不同的频段计算相应的韵律特征包括以下处理中的一项或多项:针对第一频段计算语音信号的厚度特征,其中所述厚度特征基于在第一频段的频域能量;针对第二频段计算语音信号的力度特征,其中所述力度特征基于在第二频段的时域能量;以及针对第三频段计算语音信号的层次特征,其中所述层次特征基于在第三频段的时域包络。