一种基于音频特征的数字音频延展方法
本发明提供了一种基于音频特征的数字音频延展方法,在数字音频时域延展前,根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段,保证插入操作后音频片段之间自然衔接。在插入操作后,通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展,重复进行至达到延展要求,最大限度地降低音频延展对于音频质量的影响,保证整首乐曲在延展后的播放效果,由于乐曲在被延展后听觉效果与原乐曲接近,没有破坏乐曲的欣赏性。
发明专利
CN201110177195.3
2011-06-28
CN102855883A
2013-01-02
G10L21/04(2013.01)I
清华大学
王朝坤;王建民;汪浩;刘璋
100084 北京市海淀区清华园一号
北京润泽恒知识产权代理有限公司 11319
苏培华
北京;11
一种基于音频特征的数字音频延展方法,其特征在于,所述方法包括:将原始数字音频文件按照预设标准进行分段,得到以段落为单位记录乐曲信息的数据;根据段落间的相似性对段落分类;选取合适的连续段落插入原乐曲,使其达到用户需求时长的80%到120%;对于插入后的乐曲,选取抗性符合预设需求的段落,对该段落进行长度的时域修改,并重复该步骤,直到达到用户需求时长。