信息处理设备、信息处理方法和程序
本发明涉及一种信息处理设备、信息处理方法和程序。信息处理设备包括:基于音频的语音识别处理单元,输入有作为真实空间的观察信息的音频信息,其执行基于音频的语音识别处理,从而生成被确定有高概率是被说出的字信息;基于图像的语音识别处理单元,输入有作为真实空间的观察信息的图像信息,其分析包含在输入图像中的每个用户的嘴部运动,从而生成嘴部运动信息;音频图像结合的语音识别得分计算单元,输入有字信息和嘴部运动信息,其执行对接近字信息的嘴部运动设置高得分的得分设置处理,从而执行得分设置处理;以及信息整合处理单元,输入有得分,并且执行说话者指定处理。
发明专利
CN201110059742.8
2011-03-04
CN102194456A
2011-09-21
G10L15/24(2006.01)I
索尼公司
泽田务
日本东京都
北京集佳知识产权代理有限公司 11227
杜诚%贾萌
日本;JP
一种信息处理设备,包括:基于音频的语音识别处理单元,输入有作为真实空间的观察信息的音频信息,所述基于音频的语音识别处理单元执行基于音频的语音识别处理,从而生成被确定有高概率是被说出的字信息;基于图像的语音识别处理单元,输入有作为所述真实空间的观察信息的图像信息,所述基于图像的语音识别处理单元分析包含在所述输入图像中的每个用户的嘴部运动,从而生成以用户为单位的嘴部运动信息;音频图像结合的语音识别得分计算单元,从所述基于音频的语音识别处理单元输入有字信息,并且从所述基于图像的语音识别处理单元输入有所述以用户为单位的嘴部运动信息,所述音频图像结合的语音识别得分计算单元执行对接近所述字信息的嘴部运动设置高得分的得分设置处理,从而执行以用户为单位的得分设置处理;以及信息整合处理单元,输入有所述得分,并且基于所输入的得分执行说话者指定处理。