10.3969/j.issn.0258-8021.2021.03.14
基于隐马尔可夫模型的全外显子测序拷贝数变异检测算法研究
拷贝数变异(CNV)是基因组变异的一种非平衡结构变异,与癌症等许多复杂疾病相关.目前,基于隐马尔可夫模型(HMM)的CNV检测算法已经成为基因检测研究中的一大热点,但是对于这些基于HMM的CNV检测工具并没有进行过系统的比较,导致在应用时选择困难.选取5种具有代表性的基于HMM的CNV检测工具:ExomeDepth、ExomeCopy、XHMM、ADTex和CANOES,分别使用仿真和真实的全外显子组测序数据进行检测,选择真阳性率(TPR)、假发现率(FDR)、运行时间等作为评价指标,对不同覆盖深度、CNV密度等情况下算法的性能进行评估.结果 表明:随着覆盖深度的增加,5种工具的TPR上升、FDR下降;CNV密度的变化也会影响CNV检测工具的TPR.此外,ExomeDepth对于真实数据的检测精度明显高于其他算法,是无特殊需求时的首选算法.在相同条件下,ExomeCopy运行速度最快,XHMM速度最慢.根据实验结果,对不同应用场景推荐合适的CNV检测算法,可帮助研究人员根据自身项目情况选择合适的CNV检测工具,也有助于在临床上的应用.
拷贝数变异;高通量测序技术;全外显子组;隐马尔可夫模型
40
R318(医用一般科学)
国家自然科学基金61771381
2021-08-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
380-384