智能化语言流利度识别方法、装置、电子设备及存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

智能化语言流利度识别方法、装置、电子设备及存储介质

引用
本发明涉及人工智能技术,揭露一种智能化语言流利度识别方法,包括:对原始语音进行去噪处理得到纯语音数据;将所述纯语音进行端点检测和人声提取得到语音片段;将所述语音片段转换为语音波形图,对所述语音波形图进行波形特征分析,得到语音声波特征图,计算峰值的数量,计算得到所述语音片段的语速;从所述语音声波特征图中提取拖音长度和音节长度,计算得到所述语音片段的拖音;将所述语速和所述拖音分别与预设语速阈值以及预设拖音阈值进行比较,得出语言流利度判断结果。本发明还提出一种智能化语言流利度识别装置、电子设备以及一种计算机可读存储介质,可以实现语音的流利度判断功能。

发明专利

CN202010248310.0

2020-04-01

CN111554324A

2020-08-18

G10L25/51(2013.01)

深圳壹账通智能科技有限公司

王德勋;徐国强

518000 广东省深圳市前海深港合作区前湾一路1号A栋201室

深圳市沃德知识产权代理事务所(普通合伙)

高杰%于志光

广东;44

1.一种智能化语言流利度识别方法,其特征在于,所述方法包括: 接收原始语音数据,对所述原始语音数据进行去噪处理得到纯语音数据; 对所述纯语音数据进行端点检测和人声提取,得到语音片段; 将所述语音片段转换为语音波形图,对所述语音波形图进行波形特征分析,得到语音声波特征图,计算所述语音声波特征图中峰值的数量,并根据所述峰值的数量,计算得到所述语音片段的语速; 从所述语音声波特征图中提取拖音长度和音节长度,根据所述拖音长度和音节长度计算得到所述语音片段的拖音; 将所述语速和所述拖音分别与预设语速阈值以及预设拖音阈值进行比较,得出语言流利度判断结果。 2.如权利要求1所述的智能化语言流利度识别方法,其特征在于,所述对所述原始语音数据进行去噪处理得到纯语音数据,包括: 计算所述原始语音数据的语音频率; 提取所述语音频率的噪声相位和噪声幅值,根据所述噪声相位和所述噪声幅值,得到噪声成分; 从所述原始语音数据中过滤掉所述噪声成分,得到所述纯语音数据。 3.如权利要求1所述的智能化语言流利度识别方法,其特征在于,所述将所述纯语音数据进行端点检测和人声提取,得到语音片段,包括: 将所述纯语音数据利用人声信号短时特性与非人声信号短时特性的差异进行端点检测,得出人声开始和结束的端点; 在所述人声开始和结束的端点基础上,利用语音帧信号中的短时能量进行人声提取,得到所述语音片段。 4.如权利要求1所述的智能化语言流利度识别方法,其特征在于,所述计算所述语音声波特征图中峰值的数量,包括: 在所述语音波形图中,提取出所有的峰值,得到语音波形图的峰值; 对所述语音波形图的峰值进行剔除极大值以外的最大值处理,得到真峰值数量。 5.如权利要求4所述的智能化语言流利度识别方法,其特征在于,所述根据所述峰值的数量,计算得到所述语音片段的语速,包括: 利用下述的语速计算公式,计算得到所述语音片段的语速: 其中,S表示所述语音片段的语速,Cpeak表示所述真峰值的数量,t表示所述纯语音数据的时长。 6.如权利要求1至5中任意一项所述的智能化语言流利度识别方法,其特征在于,所述根据所述拖音长度和音节长度计算得到所述语音片段的拖音,包括: 利用下述的拖音计算公式,计算得到所述语音片段的拖音: 其中,M表示所述语音片段的拖音,C表示语音声波特征图的拖音长度,J所述语音声波特征图的音节长度。 7.如权利要求1至5中任意一项所述的智能化语言流利度识别方法,其特征在于,所述将所述语速和所述拖音分别与预设语速阈值以及预设拖音阈值进行比较,得出流利度判断结果,包括: 若所述语速大于或等于所述预设语速阈值,且所述拖音小于或等于所述预设拖音阈值,则流利度判定为第一等级; 若所述语速小于所述语速阈值,且所述拖音小于或等于所述拖音阈值,则流利度判定为第二等级; 若所述语速大于或等于所述语速阈值,且所述拖音大于所述拖音阈值,则流利度判定为第三等级; 若所述语速小于所述语速阈值,且所述拖音大于所述拖音阈值,则流利度判定为第四等级。 8.一种智能化语言流利度识别装置,其特征在于,所述装置包括: 数据接收单元,用于接收原始语音数据,对所述原始语音数据进行去噪处理得到纯语音数据; 语音提取单元,用于对所述纯语音数据进行端点检测和人声提取得到语音片段; 语速计算单元,用于将所述语音片段转换为语音波形图,对所述语音波形图进行波形特征分析,得到语音声波特征图,计算所述语音声波特征图中峰值的数量,并根据所述峰值的数量,计算得到所述语音片段的语速; 拖音计算单元,用于从所述语音声波特征图中提取拖音长度和音节长度,根据所述拖音长度和音节长度计算得到所述语音片段的拖音; 流利度判断单元,用于将所述语速和所述拖音分别与预设语速阈值以及预设拖音阈值进行比较,得出语言流利度判断结果。 9.一种电子设备,其特征在于,所述电子设备包括: 存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的智能化语言流利度识别方法。 10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的智能化语言流利度识别方法。
相关文献
评论
法律状态详情>>
2020-08-18公开
相关作者
相关机构