一种语音文本的显示方法、装置、设备及存储介质

引用

摘要：

本发明实施例公开了一种语音文本的显示方法、装置、设备及存储介质。包括：根据麦克风阵列采集的语音确定音源的第一位置信息；将所述语音转换为文本内容，并根据所述语音的音量确定所述文本内容对应的目标字体大小；根据所述第一位置信息和所述目标字体大小将所述文本内容在设定三维坐标系中显示。本发明实施例提供的语音文本的显示方法，可以将语音文本与说话人的位置及音量对应起来，提高语音文本的显示效果。

专利类型：发明专利

申请/专利号：CN202010980844.2

申请日期：2020-09-17

公开/公告号：CN112185354A

公开/公告日：2021-01-05

主分类号：G10L15/02(2006.01)

申请/专利权人:浙江同花顺智能科技有限公司

发明/设计人:余逸尘

主申请人地址:310023 浙江省杭州市余杭区五常街道同顺街18号3楼305室

专利代理机构:北京品源专利代理有限公司

代理人:孟金喆

国别省市代码:浙江;33

权利要求：

1.一种语音文本的显示方法，其特征在于，包括：根据麦克风阵列采集的语音确定音源的第一位置信息；将所述语音转换为文本内容，并根据所述语音的音量确定所述文本内容对应的目标字体大小；根据所述第一位置信息和所述目标字体大小将所述文本内容在设定三维坐标系中显示。 2.根据权利要求1所述的方法，其特征在于，所述麦克风阵列为至少三个，且设置在不同位置，根据麦克风阵列采集的语音确定音源的第一位置信息，包括：获取各麦克风阵列采集到的语音相位差；基于所述语音相位差确定音源相对于目标麦克风阵列的第一位置信息。 3.根据权利要求2所述的方法，其特征在于，所述第一位置信息包括音源与所述目标麦克风阵列的距离，确定所述语音的音量，包括：确定所述语音由目标麦克风阵列采集到时的第一音量；根据音源与所述目标麦克风阵列的距离基于设定音量衰减公式确定语音由所述音源产生时的音量。 4.根据权利要求1所述的方法，其特征在于，根据所述语音的音量确定所述文本内容对应的目标字体大小，包括：获取基准音量对应的基准字体大小；确定所述语音的音量与所述基准音量的比例；根据所述比例和所述基准字体大小确定所述文本内容对应的目标字体大小。 5.根据权利要求1所述的方法，其特征在于，所述语音的音量由振幅表征；根据所述语音的音量确定所述文本内容对应的目标字体大小，包括：获取当前对话场景包含的语音中的最大振幅和最小振幅；根据所述最大振幅和最小振幅对各语音的振幅进行归一化处理；根据归一化处理后的振幅确定各语音分别对应的目标字体大小。 6.根据权利要求2所述的方法，其特征在于，根据所述第一位置信息和所述目标字体大小将所述文本内容在设定三维坐标系中显示，包括：获取所述目标麦克风阵列在设定三维坐标系的第二位置信息；根据所述第一位置信息和所述第二位置信息确定所述音源在所述设定三维坐标系中的目标位置信息；将所述文本内容在所述目标位置中以所述目标字体大小进行显示。 7.根据权利要求6所述的方法，其特征在于，在根据所述语音的音量确定所述文本内容对应的目标字体大小之后，还包括：根据所述语音确定音源的情感信息；根据所述情感信息确定所述目标字体的颜色；相应的，将所述文本内容在所述目标位置中以所述目标字体大小进行显示，包括：将所述文本内容在所述目标位置中以所述目标字体大小及所述颜色进行显示。 8.一种语音文本的显示装置，其特征在于，包括：第一位置信息确定模块，用于根据麦克风阵列采集的语音确定音源的第一位置信息；目标字体大小确定模块，用于将所述语音转换为文本内容，并根据所述语音的音量确定所述文本内容对应的目标字体大小；文本内容显示模块，用于根据所述第一位置信息和所述目标字体大小将所述文本内容在设定三维坐标系中显示。 9.一种计算机设备，其特征在于，所述设备包括：包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1-7任一所述的语音文本的显示方法。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现如权利要求1-7中任一所述的语音文本的显示方法。

专利专题