一种基于向量机SVM的说话者年龄段识别方法

引用

摘要：

本发明公开了一种基于SVM分类器进行说话者年龄段识别的方法，该方法包括以下步骤：建立存储有不同年龄段的说话者的语音信号的语音库；对语音库中的语音信号进行预处理；对经过预处理的语音信号提取其语音特征参数；基于提取出的语音特征参数进行支持向量机训练，得到支持向量机模型；根据支持向量机模型，对待识别语音的语音特征参数X进行预测，在预测过程中，每个支持向量机的输出通过逻辑判决后，选择得票最多的作为最可能的年龄段类别，得到最终的年龄段识别结果。本发明提出的方法在一定程度上弥补了现有技术对说话者年龄段识别相关研究的空白，可以较好地进行说话者年龄段判断，在人机交互，刑侦搜索，游戏娱乐等场合具有广阔的应用前景。

专利类型：发明专利

申请/专利号：CN201310049445.4

申请日期：2013-02-07

公开/公告号：CN103151039A

公开/公告日：2013-06-12

主分类号：G10L15/02(2006.01)I

申请/专利权人:中国科学院自动化研究所%东莞中国科学院云计算产业技术创新与育成中心

发明/设计人:熊刚;孔庆杰;朱菁;王飞跃;赵红霞;朱凤华

主申请人地址:100190 北京市海淀区中关村东路95号

专利代理机构:中科专利商标代理有限责任公司 11021

代理人:宋焰琴

国别省市代码:北京;11

权利要求：

一种基于支持向量机SVM的说话者年龄段识别方法，其特征在于，该方法包括以下步骤：步骤1，建立存储有多个不同年龄段的说话者的语音信号的语音库；步骤2，对所述语音库中的语音信号进行预处理；步骤3，对经过预处理的语音信号提取其语音特征参数；步骤4，基于提取出的语音特征参数进行支持向量机训练，得到支持向量机模型；步骤5，根据所述步骤4训练得到的支持向量机模型，对待识别语音的语音特征参数X进行预测，在预测过程中，每个支持向量机的输出通过逻辑判决后，选择得票最多的作为最可能的年龄段类别，由此得到最终的年龄段识别结果。

专利专题