10.3969/j.issn.1008-0570.2005.04.116
语音人机界面标引系统的实现
本文实现了一个媒体资产管理中的语音人机界面标引系统.系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别.为实现标引的实时性,采用实时计算的方法.为了减少计算量,并没有将状态持续时间分布引入Viterbi译码,而是将其作为后处理部分.对于数字识别,以声调作为辅助判决.以此做了一个体育赛事的词库,测试表明,标引系统首选识别率达到93.5%,前五选识别率达到98%.
人机界面、语音识别、实时算法
21
TN912
2005-05-12(万方平台首次上网日期,不代表论文的发表时间)
共2页
232-233