对话语音中实时说话人检测的研究
基于端点检测出的音节切分段,提出了一种1.5秒内可变长的测试语音分段法.该方法保证了音节的完整性,提高了说话人识别率.另外利用说话人转折点多发生在语音停顿处这一现象,提出了句首识别,句中聚类的方法,有效的降低了计算时间,并为某些低配置环境提供了以牺牲少量识别率来换取系统正常运行的有效方法.
说话人检测、端点检测、说话人分段、说话人聚类
29
TP391.42;TN912.3(计算技术、计算机技术)
2008-05-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
381-384