基于16S rRNA序列物种鉴定的改进向量空间模型算法
在物种鉴定领域中, 权威方法是基于BLAST的序列比对算法, 然而该算法出现计算量过于庞大, 运算效率低以及资源消耗较高等问题. 为解决以上问题, 本文借鉴经典文献中的K-String组份向量方法, 对向量空间模型作出改进, 将其应用于基于16S rRNA序列的物种鉴定领域, 并在巴拿赫空间的理论体系下, 对改进向量空间模型算法中的遗传距离公式进行等价替换, 给出不同范数背景下对应的遗传距离公式, 供科研人员参考. 本文从计算效率和物种鉴定效果两个方面来判断改进算法的性能, 最终得到如下结论: 欧几里得空间下的内积范数从计算效率上较经典的blast算法具有显著优势, 而其分类效果在检出率这一方面, 达到了比对结果的一致性.
16S rRNA基因序列、改进向量空间模型算法、非序列对比、物种鉴定、分类
27
国家高技术研究发展计划863计划2014AA021501
2018-09-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
163-169