10.3321/j.issn:1000-6737.2009.02.007
基于整合蛋白质进化保守性的伪氨基酸组成成分预测蛋白质亚细胞定位
蛋白质亚细胞定位信息对于确定蛋白质功能非常重要,它可以提供蛋白质在什么细胞环境下相互作用或与其它分子作用的信息,另外,如果知道蛋白质在细胞中的定位将有助于在细胞水平上理解复杂的蛋白质调控路径.面对后基因时代产生的海量蛋白质序列数据,迫切需要一些自动、快速、准确地确定蛋白质亚细胞定位的方法.为此,通过整合蛋白质进化保守信息,文章提出一种新的方法预测亚细胞定位.该方法基于Chou的伪氨基酸组成成分概念,应用改进的进化保守性算法计算蛋白质序列中每一个残基的保守值,从而使每一蛋白质序列可用基于小波多尺度能量而构建的特征向量来表示.另外,蛋白质序列还可用其它特征提取方法提取的特征向量来表示,如氨基酸组成成分、加权自相关函数和矩描述子.将这些特征向量输入到多类支持向量机分类器,通过积规则系统融合这四类特征分类器的分类结果.与他人结果相比,在Jackkife交叉验证下和独立样本测试下,该方法获得了较高的预测精度,说明提出的整合蛋白质进化保守性和多特征分类器融合思想,对于蛋白质亚细胞定位预测是有效的,可与现有方法互补.
进化信息、多尺度能量、加权自相关函数、矩描述子、融合、亚细胞定位
25
Q617(理论生物物理学)
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共8页
125-132