用于唤醒电子设备的方法和装置
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

用于唤醒电子设备的方法和装置

引用
本申请实施例公开了用于唤醒电子设备的方法和装置。该方法的一具体实施方式包括:获取用于设置自定义唤醒词的第一音频数据,以及对该第一音频数据进行时频变换生成第一频谱数据;根据该第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系;对该第二频谱数据进行时频逆变换,生成该第二音频数据;基于该第二音频数据,建立该自定义唤醒词对应的音频数据集合,其中,该音频数据集合用于确定是否唤醒电子设备。该实施方式实现了用户自定义设置唤醒词,从而可以提供新的唤醒电子设备的方式。

发明专利

CN201910462512.2

2019-05-30

CN111768771A

2020-10-13

G10L15/22(2006.01)

北京京东尚科信息技术有限公司

白二伟

100086 北京市海淀区知春路76号8层

北京英赛嘉华知识产权代理有限责任公司

王达佐%马晓亚

北京;11

1.一种用于唤醒电子设备的方法,包括: 获取用于设置自定义唤醒词的第一音频数据,以及对所述第一音频数据进行时频变换生成第一频谱数据; 根据所述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系; 对所述第二频谱数据进行时频逆变换,生成所述第二音频数据; 基于所述第二音频数据,建立所述自定义唤醒词对应的音频数据集合,其中,所述音频数据集合用于确定是否唤醒电子设备。 2.根据权利要求1所述的方法,其中,所述方法还包括: 响应于获取到待确定音频数据,确定所述待确定音频数据是否与所述音频数据集合中的音频数据匹配; 响应于确定所述待确定音频数据与所述音频数据集合中的音频数据匹配,唤醒所述电子设备。 3.根据权利要求1所述的方法,其中,所述频谱转换参数集合通过以下生成方式生成: 获取第三音频数据集合,其中,所述第三音频数据集合中的第三音频数据与声源距离对应,声源距离为声源与第一采集端之间的距离; 对所述第三音频数据集合中的第三音频数据进行时频变换,生成第三频谱数据集合; 根据所述第三频谱数据集合,生成频谱转换参数集合。 4.根据权利要求2所述的方法,其中,所述根据所述第三频谱数据集合,生成频谱转换参数集合,包括: 从所述第三音频数据集合中的第三音频数据对应的声源距离中,获取声源距离对,其中,所获取的声源距离对包括第一声源距离和第二声源距离; 根据所述第一声源距离对应的第三频谱数据和所述第二声源距离对应的第三频谱数据,生成所述声源距离对的频谱转换参数。 5.根据权利要求4所述的方法,其中,所述根据所述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,包括: 根据所述第一音频数据进行声源定位,确定所述第一音频数据对应的声源与第二采集端之间的定位距离; 从频谱转换参数集合中,查找与所述定位距离相匹配的声源距离对的频谱转换参数; 根据查找出的频谱转换参数和所述第一频谱数据,生成第二频谱数据。 6.根据权利要求3所述的方法,其中,所述第三音频数据集合包括近场第三音频数据和远场第三音频数据;以及 所述根据所述第三频谱数据集合,生成频谱转换参数集合,包括: 根据近场第三频谱数据和远场声源距离对应的远场第三频谱数据,生成与所述远场声源距离对应的频谱转换参数,其中,近场第三频谱数据由近场第三音频数据时频变换生成。 7.根据权利要求6所述的方法,其中,所述获取用于设置自定义唤醒词的第一音频数据,以及对所述第一音频数据进行时频变换生成第一频谱数据,包括: 获取用于设置自定义唤醒词的近场第一音频数据,以及根据所述近场第一音频数据生成的近场第一频谱数据;以及 所述根据所述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,包括: 根据所述近场第一频谱数据和与远场声源距离对应的频谱转换参数,生成与所述远场声源距离对应的远场第二音频数据。 8.一种用于唤醒电子设备的装置,包括: 获取单元,被配置成获取用于设置自定义唤醒词的第一音频数据,以及对所述第一音频数据进行时频变换生成第一频谱数据; 第一生成单元,被配置成根据所述第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系; 第二生成单元,被配置成对所述第二频谱数据进行时频逆变换,生成所述第二音频数据; 建立单元,被配置成基于所述第二音频数据,建立所述自定义唤醒词对应的音频数据集合,其中,所述音频数据集合用于确定是否唤醒电子设备。 9.根据权利要求8所述的装置,其中,所述装置还包括: 确定单元,被配置成响应于获取到待确定音频数据,确定所述待确定音频数据是否与所述音频数据集合中的音频数据匹配; 唤醒单元,被配置成响应于确定所述待确定音频数据与所述音频数据集合中的音频数据匹配,唤醒所述电子设备。 10.根据权利要求9所述的装置,其中,所述频谱转换参数集合通过以下生成方式生成: 获取第三音频数据集合,其中,所述第三音频数据集合中的第三音频数据与声源距离对应,声源距离为声源与第一采集端之间的距离; 对所述第三音频数据集合中的第三音频数据进行时频变换,生成第三频谱数据集合; 根据所述第三频谱数据集合,生成频谱转换参数集合。 11.一种电子设备,包括: 一个或多个处理器; 存储装置,其上存储有一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。 12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
相关文献
评论
法律状态详情>>
2020-10-13公开
2020-10-13公开
相关作者
相关机构