10.3969/j.issn.1005-3085.2010.06.002
基于序列和局部信息熵的蛋白质折叠速率预测模型
正确预测蛋白质折叠速率对理解蛋白质的折叠机制非常重要.本文从AAindex数据库中的531种残基物理化学性质、序列长度信息和局部结构信息熵中筛选特征,从而提出了一个基于蛋白质序列信息的线性回归模型.针对三种折叠机制two-state,multi-state和mixed-state,用Jackknife验证模犁,预测的折叠速率和实验验证的折叠速率相关系数分别为0.790,0.829和0.778.本文结果表明四阶局部结构信息熵和折叠速率有很高的负相关性;蛋白质的长度和蛋白质的折叠速率成反比关系;螺旋的含量会加快蛋白质的折叠过程.对two-state蛋白质β折叠的含量会减慢蛋白质的折叠过程;和其他模型相比,我们提出的线性回归模型具有输入参数少,计算简单,平均绝对误差小的优点.
蛋白质折叠速率、基因序列的预测方法、局部结构信息熵、线性回归
27
O236(控制论、信息论(数学理论))
国家自然科学基金10671100,20836005;刘徽应用数学研究中心、天津大学、南开大学联合研究项目;天津市自然科学基金07JCZDJC06400
2011-03-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
959-966