语音识别语言模型
在一种实施方式中,语音或音频通过语音识别系统转换成可搜索的格式。该语音识别系统使用包括某些词的出现概率的语言模型,这些概率可以取决于其他词或词序列的出现。该语言模型是部分地从个人词表构建的。个人词表是通过来自网络流量的已知文本确定的,该网络流量包括电子邮件以及互联网帖子。该语音识别系统可以基于两个用户之间的联系将一个用户的个人词表并入到另一个用户的语言模型中。该联系可以由电子邮件、电话通话或者社交网络服务中的互动来触发。该语音识别系统可以基于从得出的语言模型计算出的置信分值来移除或添加个人词表到语言模型中。
发明专利
CN201180052260.8
2011-08-09
CN103262156A
2013-08-21
G10L15/07(2013.01)I
思科技术公司
阿舒拓史·A·马勒高恩卡;甘努·萨蒂施·库玛;盖德·K·M·乔尔特
美国加利福尼亚州
北京东方亿思知识产权代理有限责任公司 11258
李晓冬
美国;US
一种方法,包括:监视来自多个用户的网络流量,所述多个用户包括第一用户和第二用户;从所述网络流量提取词;为所述多个用户中的每个用户构建个人词表;以及利用至少部分地基于所述第二用户的个人词表的语言模型,将所述第一用户的音频转换成文本。