对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法

引用
本发明公开了一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法。针对具有规律性鼓点节奏的音乐进行音乐小节的参数提取和估计并生成小节位置偏移矩阵,对音乐内容中提取符合人体感知的必备参数,通过非线性的Bark子带分离,获得各子带的能量参数矩阵,矩阵内部以块形式进行交织做差,最终判决输出为二维乐纹图像,将小节位置偏移矩阵与二维乐纹图像生成一个独立的可表示的特定的“乐纹”文件。本发明主要针对鼓点较为清晰的古典音乐(正版)提取其特定“乐纹”,作为音乐自身的独立“指纹”,同时也可以提取翻版古典音乐(盗版、盗录、翻录)的乐纹信息,并进行比对,最终通过误差判决是否为正版音乐。

发明专利

CN201310027662.3

2013-01-24

CN103077706A

2013-05-01

G10L15/02(2006.01)I

南京邮电大学

林晓勇;蒋玲慧;张跃;赵静;穆祥女

210003 江苏省南京市鼓楼区新模范马路66号

南京经纬专利商标代理有限公司 32200

朱小兵

江苏;32

一种对规律性鼓点节奏的音乐进行乐纹特征提取及表示方法,其特征在于:包括对原始音乐的预处理过程、二维乐纹图像生成过程、音乐节奏起点位置提取过程、乐纹特征文件生成过程;具体步骤如下:A、预处理过程如下:步骤A1、采用重叠系数为31/32的平移窗模式对原始音乐文件进行样值序列分帧,得到若干基于时间序列的数据帧;步骤A2、对于A1得到数据帧进行预加重处理,过滤背景噪声和信道白噪声;步骤A3、采用滤波器过滤数据中由于录音设备带来的白噪声以及部门短时高频干扰噪声,得到连续的数据帧;步骤A4,对连续的数据帧进行加载汉宁窗操作,将其转换为时域信号;步骤A5、将步骤A4得到的时域信号采用FFT变换变成频域离散信号,即频域矩阵{H(i,j)},并将该频域矩阵{H(i,j)}采用Db格式矩阵E(k)=10log10(|H(i,j)|2)换算成相应频点能量矩阵{E(i,j)};其中,H(i,j)为在时间连续i帧坐标下、j频率时短时帧的信号幅度,E(i,j)表示坐标(i,j)对应的频点能量,k代表时间连续帧数,i、j、k均为自然数;B、二维乐纹图像生成过程如下:步骤B1、对步骤A5产生的频点能量矩阵{E(i,j)},采用Bark曲线表进行非线性的Bark子带分离;步骤B2、对各个子带进行人耳感知门限的过滤,保留人类听觉系统能迅速敏感到的能量点;步骤B3、对应Bark曲线的非线性值,以连续子带的各频点索引作为子带分离的划分边界,进行子带能量求和,得到一个连续矩阵{J(m,n)},其中m∈(2,32),n∈(1,∞);然后对相邻块之间进行交织块处理,采用三值法输出判决结果,得到一个由三值{-1,0,1}组成的矩阵,即乐纹特征值;步骤B4、对输出的乐纹特征值进行可视化图像展示,即对所述三值{-1,0,1}分别使用RGB色进行绘制;C、音乐节奏起点位置提取过程,具体包括:步骤C1、通过对步骤A获取的能量矩阵,进行连续帧能量估计,通过对过零率以及平均帧能量门限的判决,判断静默音和背景噪声,获得起点帧的位置偏移的集合{T(k)},k为范围从1到所获得的全部起点总数;步骤C2、限定频点索引范围,在起点序列内对频点差值进行计算,对局部功率最小值进行过滤;对过滤后的起点序列,计算相邻T(k)之间的距离,记为{D(k)}序列;步骤C3、对{D(k)}序列进行K‑Means聚类计算,获取其最大子集{Dm(p)},其中p表示从1到该子集的最大总数,Dm是D(k)序列最大子集的标识;步骤C4、提取{Dm(p)}的对应时间位置,作为最终有效节奏起点的偏移数据;D、乐纹特征文件生成过程,具体为:将步骤B以及步骤C的最终结果合成一个文件,将步骤C的结果作为该文件的头部,步骤B的结果作为该文件的数据体,则最后生成一种可以唯一标示该首音乐的可视化乐纹数据文件。
相关文献
评论
法律状态详情>>
2013-05-01公开
2016-12-14专利实施许可合同备案的生效、变更及注销
2018-02-09专利实施许可合同备案的生效、变更及注销
2019-01-08专利权的终止
2015-03-25授权
2013-06-05实质审查的生效
相关作者
相关机构