基于音频的人员积极性分析方法、装置、设备及存储介质

引用

摘要：

本发明涉及语音处理技术，揭露了一种基于音频的人员积极性分析方法，包括：对获取的音频数据进行音频增强处理和语音段切割，得到语音段集；提取语音段集中各语音段的片段特征；获取目标人员的标准语音特征，对标准语音特征和片段特征进行匹配分析，根据匹配分析的结果选取与标准语音特征相应的目标语音段；对目标语音段进行语音分析，得到目标语音段的语音时长、语音音量和语音语速；根据分析结果计算所述目标人员的积极度。此外，本发明还涉及区块链技术，所述标准语音特征可存储于区块链的节点。本发明还提出一种基于音频的人员积极性分析装置、设备以及介质。本发明可以解决使用音频分析对人员积极性进行判断的准确率不高的问题。

专利类型：发明专利

申请/专利号：CN202011508395.8

申请日期：2020-12-18

公开/公告号：CN112634938A

公开/公告日：2021-04-09

主分类号：G10L25/03(2013.01)

申请/专利权人:平安银行股份有限公司

发明/设计人:唐玢峰

主申请人地址:518000 广东省深圳市罗湖区深南东路5047号

专利代理机构:深圳市沃德知识产权代理事务所(普通合伙)

代理人:高杰%于志光

国别省市代码:广东;44

权利要求：

1.一种基于音频的人员积极性分析方法，其特征在于，所述方法包括：获取音频数据，对所述音频数据进行音频增强处理，得到增强音频数据；对所述增强音频数据进行语音段切割，得到语音段集；对所述语音段集进行特征提取，得到所述语音段集中各语音段的片段特征；获取目标人员的标准语音特征，对所述标准语音特征和所述片段特征进行匹配分析，根据匹配分析的结果选取所述语音段集中与所述标准语音特征相应的目标语音段；对所述目标语音段进行语音分析，得到所述目标语音段的语音时长、语音音量和语音语速；根据所述语音时长、语音音量和语音语速计算所述目标人员的积极度。 2.如权利要求1所述的基于音频的人员积极性分析方法，其特征在于，所述对所述音频数据进行音频增强处理，得到增强音频数据，包括：对所述音频数据进行降噪处理，得到降噪音频数据；对所述降噪音频数据进行音频加重处理，得到增强音频数据。 3.如权利要求1所述的基于音频的人员积极性分析方法，其特征在于，所述对所述增强音频数据进行语音段切割，得到语音段集，包括：持续检测所述增强音频数据的语音强度；当所述语音强度小于预设的分贝阈值时，确定所述增强音频数据为无人声片段；当所述语音强度大于或等于所述分贝阈值时，确定所述增强音频数据为有人声片段；删除所述增强音频数据中的无人声片段，得到语音段集。 4.如权利要求1所述的基于音频的人员积极性分析方法，其特征在于，所述对所述语音段集进行特征提取，得到所述语音段集中各语音段的片段特征，包括：对所述语音段集中各语音段进行卷积处理，得到卷积语音段集；对所述卷积语音段集进行全局最大池化处理，得到池化语音段集；利用第一全连接层对所述池化语音段集进行全连接处理，得到全连接语音段集；利用第二全连接层对所述全连接语音段集进行全连接处理，得到所述语音段集中各语音段的片段特征。 5.如权利要求1至4中任一项所述的基于音频的人员积极性分析方法，其特征在于，所述对所述标准语音特征和所述片段特征进行匹配分析，根据匹配分析的结果选取所述语音段集中与所述标准语音特征相应的目标语音段，包括：将目标人员的所述标准语音特征进行向量转化，得到第一语音特征向量；将所述片段特征进行向量转化，得到与各语音段的所述片段特征相对应的第二语音特征向量；计算所述第一语音特征向量和与各语音段的所述片段特征相对应的第二语音特征向量的距离值；筛选出所述距离值小于预设阈值的第二语音特征向量对应的片段特征，确定筛选出的片段特征对应的语音段为与所述目标语音段。 6.如权利要求5所述的基于音频的人员积极性分析方法，其特征在于，所述将目标人员的所述标准语音特征进行向量转化，得到第一语音特征向量，包括：获取所述标准语音特征中每个字对应的字节向量集，所述字节向量集包含所述标准语音特征中每个字节的字节向量；将标准语音特征中每个字节按照所述字节向量集中的字节向量分别进行编码，得到编码字节集；将所述编码字节集中的编码字节进行拼接，得到所述第一语音特征向量。 7.如权利要求1所述的基于音频的人员积极性分析方法，其特征在于，所述对所述目标语音段进行语音分析，得到所述目标语音段的语音时长、语音音量和语音语速，包括：检测所述目标语音段的语音时长；持续检测所述目标语音段的语音强度，根据所述语音时长和所述语音强度计算所述目标人员的语音音量；对所述目标语音段进行语音识别，统计语音识别结果中用户的语音字数；根据所述语音时长和所述语音字数计算所述目标人员的语音语速。 8.一种基于音频的人员积极性分析装置，其特征在于，所述装置包括：音频增强模块，用于获取音频数据，对所述音频数据进行音频增强处理，得到增强音频数据；语音切割模块，用于对所述增强音频数据进行语音段切割，得到语音段集；特征提取模块，用于对所述语音段集进行特征提取，得到所述语音段集中各语音段的片段特征；匹配分析模块，用于获取目标人员的标准语音特征，对所述标准语音特征和所述片段特征进行匹配分析，根据匹配分析的结果选取所述语音段集中与所述标准语音特征相应的目标语音段；语音分析模块，用于对所述目标语音段进行语音分析，得到所述目标语音段的语音时长、语音音量和语音语速；积极度计算模块，用于根据所述语音时长、语音音量和语音语速计算所述目标人员的积极度。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于音频的人员积极性分析方法。 10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于音频的人员积极性分析方法。

专利专题