10.3969/j.issn.1003-0077.2014.05.023
维吾尔语语音检索技术研究
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义.目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段.该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建.最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%.
维吾尔语、语音检索、语音识别、词图、混淆网络、倒排索引
28
TP391(计算技术、计算机技术)
国家自然科学基金61363063;973国家重点基础研究计划2014CB340506;新疆维吾尔自治区科技计划项目201312104
2014-10-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
182-186,197