语音翻译装置、语音翻译方法以及记录介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音翻译装置、语音翻译方法以及记录介质

引用
本发明提供语音翻译装置、语音翻译方法及记录介质。语音翻译装置(1)对第1说话者与第2说话者的会话进行翻译,第1说话者以第1语言说话,第2说话者以与第1语言不同的第2语言说话,具备:语音检测部(22),从输入到语音输入部(21)的声音中,检测第1及第2说话者发出的语音区间;显示部(27),通过由语音检测部检测到的语音区间的语音被语音识别,显示该语音所示的第1语言向第2语言的翻译结果,并且显示从第2语言向第1语言的翻译结果;说话指示部(25),在第1说话者说话后,将催促第2说话者说话的内容经由显示部以第2语言输出,并且在第2说话者说话后,将用于催促第1说话者说话的内容经由显示部以第1语言输出。

发明专利

CN202010185150.X

2020-03-17

CN111739511A

2020-10-02

G10L15/00(2013.01)

松下电器产业株式会社

古川博基;坂口敦;西川刚树

日本大阪府

永新专利商标代理有限公司

安香子

日本;JP

1.一种语音翻译装置,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话, 所述语音翻译装置具备: 语音检测部,从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间; 显示部,通过由所述语音检测部检测的语音区间的语音被语音识别,从而所述显示部对该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且,对从所述第2语言翻译成所述第1语言的翻译结果进行显示;以及 说话指示部,在所述第1说话者说话后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话后,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。 2.如权利要求1所述的语音翻译装置, 所述语音翻译装置进一步具备优先说话输入部,所述优先说话输入部在所述第1说话者或所述第2说话者发出的语音被语音识别的情况下,使进行了该语音识别的所述第1说话者或所述第2说话者发出的语音优先被再次进行语音识别。 3.如权利要求1或2所述的语音翻译装置, 所述语音翻译装置进一步具备: 语音输入部,被输入所述第1说话者与所述第2说话者进行会话的语音; 语音识别部,通过对由所述语音检测部检测到的语音区间的语音进行语音识别,从而转换为文本文件; 翻译部,将由所述语音识别部转换的所述文本文件从所述第1语言翻译成所述第2语言,并且从所述第2语言翻译成所述第1语言;以及 语音输出部,将由所述翻译部翻译的结果,通过语音来输出。 4.如权利要求3所述的语音翻译装置, 所述语音输入部被设置多个, 所述语音翻译装置进一步具备: 第1波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第1说话者的语音的声源方向; 第2波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第2说话者的语音的声源方向; 输入切换部,将获得的信号切换成所述第1波束成形部的输出信号、或所述第2波束成形部的输出信号;以及 声源方向估计部,通过对被输入到多个所述语音输入部的语音进行信号处理,从而对声源方向进行估计, 所述说话指示部,使所述输入切换部进行或者获得所述第1波束成形部的输出信号、或者获得所述第2波束成形部的输出信号的切换。 5.如权利要求3所述的语音翻译装置, 所述语音输入部被设置多个, 所述语音翻译装置进一步具备: 声源方向估计部,通过对被输入到多个所述语音输入部的语音进行信号处理,来估计声源方向;以及 控制部,使所述第1语言显示在,与相对于该语音翻译装置的所述第1说话者的位置对应的所述显示部的显示区域,使所述第2语言显示在,与相对于该语音翻译装置的所述第2说话者的位置对应的所述显示部的显示区域, 所述控制部, 对显示方向与由所述声源方向估计部估计的声源方向进行比较,该显示方向是从该语音翻译装置的显示部朝向所述第1说话者或所述第2说话者的方向,并且是在所述显示部的某一个显示区域一侧进行显示的方向, 在所述显示方向与估计的声源方向实质上一致的情况下,使所述语音识别部以及所述翻译部执行工作, 在所述显示方向与估计的声源方向不同的情况下,使所述语音识别部以及所述翻译部的工作停止。 6.如权利要求5所述的语音翻译装置, 在所述控制部使所述语音识别部以及所述翻译部的工作停止的情况下,所述说话指示部再次输出以指示的语言进行的催促说话的内容。 7.如权利要求5所述的语音翻译装置, 在所述显示方向与估计的声源方向不同的情况下,所述说话指示部在所述控制部开始进行比较并经过了规定期间之后,再次输出以指示的语言进行的催促说话的内容。 8.如权利要求3所述的语音翻译装置, 所述语音输入部被设置多个, 所述语音翻译装置进一步具备: 第1波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第1说话者的语音的声源方向; 第2波束成形部,通过对被输入到多个所述语音输入部中的至少一部分的语音输入部的语音进行信号处理,从而将收集声音的指向性控制为所述第2说话者的语音的声源方向;以及 声源方向估计部,通过对所述第1波束成形部的输出信号以及所述第2波束成形部的输出信号进行信号处理,从而对声源方向进行估计。 9.如权利要求1或2所述的语音翻译装置, 所述说话指示部, 在该语音翻译装置的启动时,将催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出, 在由所述第1说话者发出的语音从所述第1语言被翻译成所述第2语言,且翻译结果被显示到所述显示部之后,将催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出。 10.如权利要求3所述的语音翻译装置, 所述说话指示部, 在翻译开始后,使所述语音输出部将用于催促说话的语音,以规定的次数输出, 在所述规定的次数的用于催促说话的语音被输出后,使所述显示部输出用于催促说话的消息。 11.如权利要求3所述的语音翻译装置, 所述语音识别部输出对语音进行语音识别后的结果、以及该结果的可靠性分数, 所述说话指示部,在从所述语音识别部获得的所述可靠性分数为阈值以下的情况下,不进行所述可靠性分数为阈值以下的语音的翻译,而将催促说话的内容,经由所述显示部以及所述语音输出部的至少一方来输出。 12.一种语音翻译方法,用于第1说话者与第2说话者的会话,所述第1说话者以第1语言说话,所述第2说话者是所述第1说话者的会话对方,并且以与所述第1语言不同的第2语言说话, 在所述语音翻译方法中包括: 从被输入到语音输入部的声音中,检测所述第1说话者以及所述第2说话者发出的语音的语音区间, 通过对检测出的语音区间的语音进行语音识别,从而显示部对从该语音所示的所述第1语言被翻译成所述第2语言的翻译结果进行显示,并且对从所述第2语言翻译成所述第1语言的翻译结果进行显示, 在所述第1说话者说话之后,将用于催促所述第2说话者说话的内容,经由所述显示部,以所述第2语言来输出,并且,在所述第2说话者说话之后,将用于催促所述第1说话者说话的内容,经由所述显示部,以所述第1语言来输出。 13.一种计算机可读取的非暂时性的记录介质,记录有用于使计算机执行权利要求12所述的语音翻译方法的程序。
相关文献
评论
法律状态详情>>
2020-10-02公开
相关作者
相关机构