10.16337/j.1004-9037.2018.04.008
基于RNA-seq的基因训练集构建方法
针对基因组新测序物种缺乏高质量的基因结构用于从头预测软件训练的现状,本文提出了一种以新测序物种自身RNA-seq组装为基础的可靠基因训练集构建方法(Building reliable training gene set ,BRTGS) .该方法利用RNA-seq组装获得大量初始基因结构,然后根据蛋白同源证据筛选具有正确且编码区相对完整的基因结构,最后综合利用RNA-seq组装结构和蛋白同源证据统计信息确定的基因起始密码子和终止密码子位置,从而获得基因完整的编码结构.实验结果表明,该方法不仅可为各种组装水平的基因组构建高质量的基因训练集,而且从头预测软件在这些基因集上训练后能够获得很好的预测性能.
生物信息学、基因结构、RNA-seq、蛋白同源、训练基因集
33
TN713;Q751(基本电子电路)
国家自然科学基金31301691;教育部中央高校基本业务费KYZ201667,KJQN201430
2018-10-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
637-645