对基因组拼接算法的深入分析和探讨
研究基因组拼接算法,进而更高效地实现全基因组拼接、获取生物体遗传信息,对于生命科学研究具有重要的意义.拼接之前对数据进行一定的预处理.拼接采用经典的DBG算法,分析了DBG算法的实现步骤以及需要注意的问题.根据read切割K-mer,然后采用位运算压缩存入Hash表.以有效的K-mer为顶点,相邻的K-mer之间连有向边,建立DBG图,然后在该图中寻找Euler路径.每一条Euler路径对应一条contig.最后进行参数组合实验,并将结果与专业软件CLC的结果进行对比.两者效率相近,说明了算法的高效性.
拼接、DBG图、K-mer、contig、scaffold
11
Q812;TP311(生物工程学(生物技术))
该文受到中央高校基本科研业务费专项资金资助和中国石油大学华东自主创新科研计划资助
2016-03-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
123-124,128