一种商户用蓝牙设备的音频识别方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种商户用蓝牙设备的音频识别方法

引用
本发明公开了一种商户用蓝牙设备的音频识别方法,其使用时域信号分析技术,采用基音周期及原始、一阶、二阶过零率直方图结合的算法实时检测预先采集的1秒到5秒的样本,如送入蓝牙设备的实时音频流中以样本开头,则蓝牙设备播放预设长度的音频流,其他的音频全部过滤,本发明可用于微信及支付宝收款音箱,本发明在蓝牙设备中增加了音频识别模型,通过音频识别模型识别接收的音频内容,自动过滤无关信息,所采用的模型算法复杂度低,适用于低算力的蓝牙设备。

发明专利

CN202010823375.3

2020-08-17

CN111933183A

2020-11-13

G10L25/51(2013.01)

深圳一块互动网络技术有限公司

江周平

518000 广东省深圳市南山区粤海街道滨海社区高新南十道87、89、91号软件产业基地2栋C4层403

厦门致群财富专利代理事务所(普通合伙)

刘兆庆

广东;44

1.一种商户用蓝牙设备的音频识别方法,应用于与通讯终端相连接的蓝牙设备,其特征在于,包括以下步骤: S1、获取商户收款用提示音频,进行分类并存储在音频数据库; S2、蓝牙设备获取并保存连接具有通用唯一识别码UUID信息的通讯终端; S3、通讯终端与蓝牙设备基于蓝牙协议分别进行音频的发送和接收,蓝牙设备获取通讯终端的音频信号; S4、构建音频识别模型,蓝牙设备通过音频识别模型对音频信号进行扫描,获取待识别样本; S5、从音频数据库中提取商户收款用提示音频,利用音频识别模型的时域基音检测算法及过零率原始、一阶与二阶差分直方图分别提取商户收款用提示音频与待识别样本的特征序列; S6、将获取的商户收款用提示音频与待识别样本的特征序列进行比对,相似度超过预设定阈值,判定为正在播报商户收款提示,蓝牙设备播放后续指定长度的内容,低于预设定阈值,蓝牙设备过滤该音频。 2.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述步骤S1中的商户收款用提示音频采用具有支付、收款及转账功能的软件的提示音。 3.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述通讯终端为具有蓝牙通讯的电子终端设备,采用手机、平板设备、PC及银行收款设备。 4.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述步骤S3中获取到的音频信号为蓝牙设备对音频解码后的PCM信号,所述步骤S4中获取待识别样本具体为音频识别模型选取1S-5S的滑动窗口在PCM信号上进行扫描,选取1S-5S的待识别样本。 5.如权利要求4所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述滑动窗口采用1S的滑动窗口。 6.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述音频识别模型的时域基音检测算法对商户收款用提示音频与待识别样本的特征序列进行短时分析的分帧处理,提取10-40ms的帧长,并在帧长与帧间隔上分别设置取样点。 7.如权利要求6所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述帧长采用30ms,帧长与帧间隔上均设置120个取样点。 8.如权利要求6所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述音频识别模型还包括用于动态调整商户收款用提示音频与待识别样本的算法,通过算法计算商户收款用提示音频与待识别样本取样点之间的距离并动态规划出两者之间的最短距离,通过对比并判断商户收款用提示音频与待识别样本的相似度。 9.如权利要求8所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述算法采用DTW算法。 10.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述过零率原始、一阶与二阶差分信号直方图采用10ms的长度进行统计,重叠50%,原始、一阶、二阶直方图各有200个值,使得直方图有足够波动性来区分待测音频和样本音频的相似度。 11.如权利要求1所述的一种商户用蓝牙设备的音频识别方法,其特征在于:所述蓝牙协议采用A2DP协议。
相关文献
评论
法律状态详情>>
2020-11-13公开
2020-11-13公开
相关作者
相关机构