基于用户行为日志的语音模型更新方法及装置
本发明提供一种基于用户行为日志的语音模型更新方法及装置。本发明实施例通过根据所获取的用户行为日志,提取高频词组和/或新词组,进而根据所述高频词组和/或所述新词组,更新词汇表,使得能够利用更新之后的所述词汇表,训练语音模型,这样,则可以利用训练出的新的语音模型进行语音识别,由于根据用户行为日志更新了词汇表,因此,会训练出新的语音模型,这样,能够避免现有技术中由于新的词组的出现而导致的采用已有的语音模型进行语音识别的识别准确率降低的问题,从而提高了语音识别的可靠性。
发明专利
CN201310303654.7
2013-07-18
CN103400576A
2013-11-20
G10L15/06(2013.01)I
百度在线网络技术(北京)有限公司
曹立新
100085 北京市海淀区上地十街10号百度大厦
北京鸿德海业知识产权代理事务所(普通合伙) 11412
袁媛
北京;11
一种基于用户行为日志的语音模型更新方法,其特征在于,包括:获取用户行为日志;根据所述用户行为日志,提取高频词组和/或新词组,所述高频词组为出现频率大于或等于预先设置的频率阈值的词汇;根据所述高频词组和/或所述新词组,更新词汇表;利用更新之后的所述词汇表,训练语音模型,所述语音模型用于进行语音识别。