DOI：10.3969/j.issn.1000-3428.2014.05.054

基于语音识别与特征的无监督语音模式提取

引用

摘要：

在语音识别与特征系统中，通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果，通过分段动态时间弯曲算法进行语言模式的搜索，采用有效的聚类算法以及置信度估计算法，提高系统性能，同时建立仅基于特征匹配的相似音频片段检测系统，不使用任何知识源，仅从语音中获取重复的语音模式，在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明，基于识别的系统具有较好的检测效果，而基于特征的系统具备多语种的推广性。

关键词：语音识别、语音模式发现、分段动态时间弯曲算法、图聚类算法、音素回环后验概率计算

分类号：TN912.34

资助基金：国家自然科学基金资助项目10925419,90920302,61072124,11074275,11161140319,91120001,61271426；国家“863”计划基金资助项目2012AA012503；中国科学院重点部署基金资助项目KGZD-EW-103-2；中国科学院战略性先导科技专项基金资助项目“面向感知中国的新一代信息技术研究”XDA06030100, XDA06030500。

在线出版日期：2014-06-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：262-265

英文信息展示

期刊专题