一种基于音频特征的数字音频延展方法

引用

摘要：

本发明提供了一种基于音频特征的数字音频延展方法，在数字音频时域延展前，根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段，保证插入操作后音频片段之间自然衔接。在插入操作后，通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展，重复进行至达到延展要求，最大限度地降低音频延展对于音频质量的影响，保证整首乐曲在延展后的播放效果，由于乐曲在被延展后听觉效果与原乐曲接近，没有破坏乐曲的欣赏性。

专利类型：发明专利

申请/专利号：CN201110177195.3

申请日期：2011-06-28

公开/公告号：CN102855883A

公开/公告日：2013-01-02

主分类号：G10L21/04(2013.01)I

申请/专利权人:清华大学

发明/设计人:王朝坤;王建民;汪浩;刘璋

主申请人地址:100084 北京市海淀区清华园一号

专利代理机构:北京润泽恒知识产权代理有限公司 11319

代理人:苏培华

国别省市代码:北京;11

权利要求：

一种基于音频特征的数字音频延展方法，其特征在于，所述方法包括：将原始数字音频文件按照预设标准进行分段，得到以段落为单位记录乐曲信息的数据；根据段落间的相似性对段落分类；选取合适的连续段落插入原乐曲，使其达到用户需求时长的80％到120％；对于插入后的乐曲，选取抗性符合预设需求的段落，对该段落进行长度的时域修改，并重复该步骤，直到达到用户需求时长。

专利专题