10.19678/j.issn.1000-3428.0059745
基于长读数和多序列比对的间隙填充方法
间隙(gap)填充方法有助于获取更加完整和准确的基因组序列,可以促进基因表达与调控、结构变异分析和物种进化的研究.虽然已有较多填充gap的方法被提出,但是填充的准确性和完整性仍有待提高.设计一种基于长读数和多序列比对的gap填充方法GapLM.将包含gap的序列集合切割成不含gap的序列集合,基于长读数和序列之间比对位置的差异对结果进行修正.通过分析比对确定覆盖每个gap区域的左侧、右侧和跨过3个序列集合.针对1个gap和其相关联的3个序列集合,采用多序列比对方法分别对3个集合中的序列进行处理和融合,并生成一致序列对gap区域进行填充.将GapLM与GMcloser、PBjelly、LR_Gapcloser 3种填充方法在2个真实数据集上进行比较,实验结果表明,GapLM具有更加完整和准确的填充结果.
gap填充;序列组装;第三代测序技术;多序列比对;长读数
47
TP391(计算技术、计算机技术)
国家自然科学基金面上项目;国家自然科学基金青年科学基金项目
2021-11-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
93-99,107