10.3778/j.issn.1673-9418.1505045
基于多样本RNA-Seq数据的表达水平估计方法
随着下一代高通量DNA测序的快速发展,RNA-Seq测序已成为转录组学分析的标准技术.在处理多样本RNA-Seq数据时,现有表达水平估计方法通常基于单个样本逐个处理,忽略了基因读段分布在样本间高度相似的特点.因此,提出了一个基于多样本RNA-Seq数据的表达水平估计方法,称为MRSeq.其关键是通过建立偏差曲线估计模型获得基因读段分布在样本之间的共享特征,通过偏差权重将共享特征嵌入到模型中,用来修正读段数据,同时通过增加稀疏约束来表现基因和异构体表达水平之间的稀疏性.进而将该模型应用到多个真实数据集进行评测,与目前主流方法的比较结果表明:MRSeq不仅能得到准确的基因和异构体表达水平,同时也获得了更有意义的生物解释.
RNA-Seq、多样本、偏差曲线、稀疏、基因和异构体表达水平
10
TP391(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant No.61170152;the Qinglan Project of Jiangsu Province;the Fundamental Research Funds for the Central Universities of China under Grant No.CXZZ11_0217
2016-06-07(万方平台首次上网日期,不代表论文的发表时间)
共10页
210-219