10.3969/j.issn.1000-3428.2013.07.016
基于声学指纹的海量MP3文件近似去重方法
在互联网中重复上传他人已经分享的歌曲会消耗网络带宽,浪费存储空间,但目前的重复数据删除方法主要基于文件的二进制特征,无法识别经过信号处理或压缩后的歌曲。针对该问题,提出一种基于声学指纹的海量MP3文件近似去重方法。结合文件消息的确定性与声学指纹的鲁棒性,在采用布隆过滤器对文件消息一次去重的基础上,根据降维后的声学指纹值进行二次近似去重,保证高效的同时提高去重率。实验结果表明,与可变分块检测方法相比,该方法的去重率可提高1倍以上,扩展性较好。
声学指纹、重复数据删除、近似去重、布隆过滤器、海量数据
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61070182,61170209
2013-10-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
73-75,82