语音数据检测方法、装置、计算机设备及存储介质

引用

摘要：

本发明公开了一种语音数据检测方法、装置、计算机设备及存储介质，接收语音检测触发指令，语音检测触发指令包括检测类型信息；若检测类型信息为第一类型信息，则采用第一监测策略对客户端的目标语音数据进行实时检测；在目标语音数据触发风险监测项中的预设预警条件时，发送提示信息至客户端的监控端；在对客户端的目标语音数据的实时检测结束后，输出质量检测项的检测结果信息；若检测类型信息为第二类型信息，则采用第二监测策略对客户端的目标语音数据进行离线检测；在对客户端的目标语音数据的离线检测结束后，输出第二监测策略的检测结果信息；从而提高了语音数据的质检效率。

专利类型：发明专利

申请/专利号：CN202010456652.1

申请日期：2020-05-26

公开/公告号：CN111681672A

公开/公告日：2020-09-18

主分类号：G10L25/51(2013.01)

申请/专利权人:深圳壹账通智能科技有限公司

发明/设计人:张山

主申请人地址:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

专利代理机构:深圳众鼎专利商标代理事务所(普通合伙)

代理人:谭果林

国别省市代码:广东;44

权利要求：

1.一种语音数据检测方法，其特征在于，包括：接收语音检测触发指令，所述语音检测触发指令包括检测类型信息；若所述检测类型信息为第一类型信息，则采用第一监测策略对客户端的目标语音数据进行实时检测，其中，所述第一类型信息指示检测类型为实时监测，所述第一监测策略包括风险监测项和质量监测项；在所述目标语音数据触发所述风险监测项中的预警条件时，发送提示信息至所述客户端的监控端；在对所述客户端的所述目标语音数据的实时检测结束后，输出所述质量检测项的检测结果信息；若所述检测类型信息为第二类型信息，则采用第二监测策略对客户端的目标语音数据进行离线检测，其中，所述第二类型信息指示检测类型为离线检测；在对所述客户端的所述目标语音数据的离线检测结束后，输出所述第二监测策略的检测结果信息。 2.如权利要求1所述的语音数据检测方法，所述第二监测策略的检测结果信息包括检测项和每一检测项对应的检测分值；在所述输出所述第二监测策略的检测结果信息之后，所述语音数据检测方法还包括：将所述目标语音数据和所述第二监测策略的检测结果信息添加至预设的检测策略数据库中，所述检测策略数据库用于存储检测完成之后的检测结果信息；对所述检测策略数据库中存储的样本检测数据进行统计，确定所述第二监测策略中每一检测项的平均分值占比，所述样本检测数据为完成检测之后并存储至检测策略数据库中的数据；发送所述每一检测项的平均分值占比至所述客户端，接收所述客户端返回的所述每一检测项的调整因子；根据所述调整因子调整所述第二监测策略。 3.如权利要求1所述的语音数据检测方法，第一监测策略包括风险监测项和质量监测项，采用第一监测策略对客户端的目标语音数据进行实时检测，包括：对所述目标语音数据进行处理，将所述目标语音数据转换为目标文本数据；根据风险监测项对所述目标语音数据和所述目标文本数据进行实时检测，获取每一所述风险监测项对应的风险结果信息，其中，所述风险监测项包括情绪分析项和关键词及敏感词检测项；根据所述质量监测项对所述目标语音数据和所述目标文本数据进行实时检测，获取每一所述质量监测项对应的质量结果信息，其中，所述质量监测项包括意图识别项、语速及静音分析项、语音交叉分析项和质检规则匹配项。 4.如权利要求3所述的语音数据检测方法，根据风险监测项对所述目标语音数据和所述目标文本数据进行实时检测，获取每一所述风险监测项对应的风险结果信息，包括：根据预设的第一评分策略对所述目标语音数据和所述目标文本数据进行情绪分析评分，获取所述情绪分析项对应的分数；根据预设的第二评分策略对所述目标文本数据进行关键词及敏感词检测评分，获得所述关键词及敏感词检测项对应的分数。 5.如权利要求3所述的根据质量监测项对所述目标语音数据和所述目标文本数据进行实时检测，获取每一所述质量监测项对应的质量结果信息，包括：根据预设的第三评分策略对所述目标文本数据进行意图识别评分，获取所述意图识别项对应的分数；根据预设的第四评分策略对所述目标语音数据进行语速及静音分析评分，获得所述语速及静音分析项对应的分数；根据预设的第五评分策略对所述目标语音数据进行语音交叉分析评分，获取所述语音交叉分析项对应的分数；根据预设的第六评分策略对所述目标文本数据进行质检规则匹配评分，获得所述质检规则匹配项对应的分数，其中，所述质检规则包括预先根据质检内容设置的文本匹配规则集，所述文本匹配规则集包括词语规则、短语规则和脚本规则。 6.如权利要求1所述的语音数据检测方法，其特征在于，在所述目标语音数据触发所述风险监测项中的预警条件之后，以及在发送提示信息至所述客户端的监控端之前，所述语音数据检测方法还包括：根据预先建立的神经网络模型，对触发所述风险监测项中的预警条件的目标语音数据进行基于注意力机制的不良语音识别，获得所述目标语音数据的文字序号分布和语音分类结果；其中，所述神经网络模型包含预设的文字库，所述文字库中每一个文字均对应有唯一的文字序号；所述目标语音数据的文字序号分布由若干个所述文字序号组成；根据所述文字序号分布和预设的不良关键词字典，确定所述目标语音数据中存在不良关键词的起始位置和终止位置；其中，所述不良关键词字典存储有预先收集的若干个不良关键词样本。 7.如权利要求6所述的语音数据检测方法，其特征在于，所述神经网络模型包括主干网络、语音识别网络和基于注意力机制建立的不良语音分类网络；所述根据预先建立的神经网络模型，对触发所述风险监测项中的预警条件的目标语音数据进行基于注意力机制的不良语音识别，包括：对触发所述风险监测项中的预警条件的目标语音数据进行特征提取，确定所述目标语音数据的频谱特征；根据所述主干网络和所述目标语音数据的频谱特征，提取出所述目标语音数据的序列特征；将所述目标语音数据的序列特征输入所述语音识别网络中，获得所述目标语音数据的文字序号分布；将所述目标语音数据的序列特征输入所述不良语音分类网络中，获得所述目标语音数据的发音分类结果。 8.一种语音数据检测装置，其特征在于，包括：语音检测触发指令接收模块，用于接收语音检测触发指令，所述语音检测触发指令包括检测类型信息；实时检测模块，用于在所述检测类型信息为第一类型信息时，采用第一监测策略对客户端的目标语音数据进行实时检测，其中，所述第一类型信息指示检测类型为实时监测，所述第一监测策略包括风险监测项和质量监测项；第一发送模块，用于在所述目标语音数据触发所述风险监测项中的预警条件时，发送提示信息至所述客户端的监控端；第一输出模块，用于在对所述客户端的所述目标语音数据的实时检测结束后，输出所述质量检测项的检测结果信息；离线检测模块，用于在所述检测类型信息为第二类型信息时，采用第二监测策略对客户端的目标语音数据进行离线检测，其中，所述第二类型信息指示检测类型为离线检测；第二输出模块，用于在对所述客户端的所述目标语音数据的离线检测结束后，输出所述第二监测策略的检测结果信息。 9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述语音数据检测方法。 10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音数据检测方法。

专利专题