10.3969/j.issn.1000-3428.2014.05.054
基于语音识别与特征的无监督语音模式提取
在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。
语音识别、语音模式发现、分段动态时间弯曲算法、图聚类算法、音素回环后验概率计算
TN912.34
国家自然科学基金资助项目10925419,90920302,61072124,11074275,11161140319,91120001,61271426;国家“863”计划基金资助项目2012AA012503;中国科学院重点部署基金资助项目KGZD-EW-103-2;中国科学院战略性先导科技专项基金资助项目“面向感知中国的新一代信息技术研究”XDA06030100, XDA06030500。
2014-06-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
262-265