10.3969/j.issn.1000-7024.2012.05.031
针对短测序片段的基因序列拼接算法
为了获得高效的拼接结果,针对新测序技术产生的较短测序片段,提出了通过对测序片段编码,将其映射到能够快速查找的自定义表中,结合高效位并行字符串模糊匹配算法-BPM,从自定义表中寻找较长连通路径的方法,实现了对短测序片段的快速拼接.实验结果表明,该算法针对500M的高质量源数据,在耗时136s的情况下,准确度可达79%,覆盖度可达82%;针对错误率为0.1%的500M源数据,在耗时150s的情况下,准确度可达72%,覆盖度可达73%.在短时间内较好的完成了拼接任务.
短测序片段、快速查找表、四进制整数、BPM(位并行匹配算法)、连通路径
33
TP274(自动化技术及设备)
国家自然科学基金项目60903318、60832011;国家973重点基础研究发展计划基金项目2009CB320803;国家自然科学基金重点项目60736046
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
1832-1836