键盘乐器弹奏音乐的处理方法、装置、电子装置
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

键盘乐器弹奏音乐的处理方法、装置、电子装置

引用
本申请提供的键盘乐器弹奏音乐的处理技术方案,根据键盘乐器的按键数量以及每个按键对应产生的音高值,建立识别音高值及其出现概率的模型;对键盘乐器产生的音频文件进行预处理,以提取其中至少一音频帧的音频特征;将音频帧的音频特征输入到上述模型中,识别出上述音频帧对应的音高值及其出现概率;根据音频帧对应的音高值及其出现概率,确定对应音频帧的内容识别结果。上述方案通过根据键盘乐器的按键数量以及每个按键对应产生的音高值而建立的识别音高值及其出现概率的模型,来识别出上述音频帧对应的音高值及其出现概率,降低了键盘乐器弹奏音乐的识别处理难度,提高了识别的准确度。

发明专利

CN202010732687.3

2020-07-27

CN111863026A

2020-10-30

G10L25/24(2013.01)

北京世纪好未来教育科技有限公司

徐成振;智鹏鹏;杨嵩

100086 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室

北京合智同创知识产权代理有限公司

李杰

北京;11

1.一种键盘乐器弹奏音乐的处理方法,其特征在于,所述方法包括: 根据所述键盘乐器的按键数量以及每个按键对应产生的音高值,建立识别音高值及其出现概率的模型; 对所述键盘乐器产生的音频文件进行预处理,以提取其中至少一音频帧的音频特征; 将所述音频帧的所述音频特征输入到所述模型中,识别出所述音频帧对应的音高值及其出现概率; 根据所述音频帧对应的音高值及其出现概率,确定对应所述音频帧的内容识别结果。 2.根据权利要求1所述的方法,其特征在于,所述音频特征为梅尔频率倒谱特征。 3.根据权利要求1所述的方法,其特征在于,所述根据所述音频帧对应的音高值及其出现概率,确定对应所述音频帧的内容识别结果,包括: 将所述音频帧对应的音高值的出现概率,与出现概率阈值进行比对; 将出现概率大于所述出现概率阈值的音高值,确定为对应所述音频帧的内容识别结果。 4.根据权利要求1所述的方法,其特征在于,所述根据所述音频帧对应的音高值及其出现概率,确定对应所述音频帧的内容识别结果之后,还包括: 根据所述音频文件的所有所述音频帧的内容识别结果,生成识别结果矩阵。 5.根据权利要求4所述的方法,其特征在于,所述根据所有所述音频帧的内容识别结果,生成识别结果矩阵之后,还包括: 获取输入的音乐选取时间片段; 根据所述音乐选取时间片段与所述音频帧的帧移,确定所述音乐选取时间片段在所述识别结果矩阵中对应的音高值,并将其作为所述音乐选取时间片段对应的音频帧的识别结果。 6.根据权利要求5所述的方法,其特征在于,所述根据所述音乐选取时间片段与所述音频帧的帧移,确定所述音乐选取时间片段在所述识别结果矩阵中对应的音高值,并将其作为所述音乐选取时间片段对应的音频帧的识别结果之后,还包括: 将所述音乐选取时间片段对应的音频帧的识别结果映射成音阶和音调的关系文本; 根据所述音阶和音调的关系文本,合成新的音频文件。 7.根据权利要求6所述的方法,其特征在于,所述根据所述音阶和音调的关系文本,合成新的音频文件,包括: 将所述音阶和音调的关系文本转换成字符序列; 对所述字符序列中的每个字符进行转换处理得到每个字符对应的字符向量; 根据所述每个字符对应的字符向量,生成字符矩阵; 根据所述字符矩阵,合成新的音频文件。 8.根据权利要求7所述的方法,其特征在于,所述根据所述字符矩阵,合成新的音频文件,包括: 对所述字符矩阵中每个字符向量进行编码处理得到每个字符的位置特征; 根据所述每个字符的位置特征,合成新的音频文件。 9.根据权利要求8所述的方法,其特征在于,所述根据所述每个字符的位置特征,合成新的音频文件,包括: 根据所述字符序列中每个字符的位置特征,计算每个字符对应的注意力上下文向量; 根据所述字符序列中所有字符及其对应的注意力上下文向量,合成新的音频文件。 10.根据权利要求9所述的方法,其特征在于,所述根据所述字符序列中所有字符及其对应的注意力上下文向量,合成新的音频文件包括: 根据所述字符序列中所有字符及其对应的注意力上下文向量,生成对应的的频谱; 根据所述频谱,合成新的音频文件。 11.一种键盘乐器弹奏音乐的处理装置,其特征在于,所述装置包括: 模型建立单元,用于根据所述键盘乐器的按键数量以及每个按键对应产生的音高值,建立识别音高值及其出现概率的模型; 预处理单元,用于对所述键盘乐器产生的音频文件进行预处理,以提取其中至少一音频帧的音频特征; 音高识别单元,用于将所述音频帧的所述音频特征输入到所述模型中,识别出所述音频帧对应的音高值及其出现概率; 内容识别单元,用于根据所述音频帧对应的音高值及其出现概率,确定对应所述音频帧的内容识别结果。 12.一种电子装置,其特征在于,包括存储器以及处理器,所述存储器上存储有计算机可执行指令,所述处理器用于执行所述计算机可执行指令以实现权利要求1-10任一所述的方法。 13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有被执行时实现权利要求1-10任一所述的方法的计算机可执行指令。
相关文献
评论
法律状态详情>>
2020-10-30公开
2020-10-30公开
相关作者
相关机构