10.3969/j.issn.1000-1220.2020.05.006
始发保优的序列比对
动态时间规整(Dynamic Time Warping,DTW)是序列比对的经典方法,可以计算动态对应的序列间距的最小值.该文从一个新颖的角度重构了DTW的理论框架,提出了DTW的可加保优和始发保优两条特性.并依赖始发保优的算法拓展能力,将DTW由普通距离延拓到平均距离、Pearson相关系数、和Tanimoto相似系数的动态优化的计算模式,建立了一系列序列比对的新方法.动态计算的Pearson相关系数和Tanimoto相似系数较常规Pearson系数和Tanimoto系数分别更能捕捉长度一致的序列之间的真实相似性.对该系列方法以计算效率最高的动态平均距离为代表作内置,进行大量标注数据集的层次聚类比较测试,证实相较于传统DTW算法在基于序列比对的聚类准确率(平均F值)上至少有35个百分点的提高.且使用kNN作序列匹配分类实验也证实了动态平均距离优于传统DTW距离.
DTW、可加保优、始发保优、平均距离、Pearson系数、Tanimoto系数
41
TP391(计算技术、计算机技术)
浙江省基础公益研究计划项目2019-LCHG
2020-06-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
932-939