DOI：10.3969/j.issn.1005-3085.2003.03.020

蛋白质二级结构的条件隐Markov性及其预测问题

引用

摘要：

蛋白质二级结构预测问题自1957年首次被提出迄今已有40多年了,从知道的文献中可以得出如下信息:在统计意义之下,蛋白质序列中氨基酸之间的相互作用较弱,所以,统计方法中所依赖的独立性假设虽然不是从物理背景中得来的,但的确有其合理性和方便之处;交互信息准则优于均方误差准则;信息和统计的思想和方法在预测二级结构中不可低估;加入蛋白质的一级结构之外的信息可帮助提高二级结构预测的精度;而直接从一级结构出发无附加信息的情况下预测二级结构,现存在的预测方法的预测精度仍然无较大突破;预测精度和所使用的蛋白质样本序列在总体样本中的覆盖率,是评估各种预测方法的有效性的两个重要指标.本文作者建立了一个集蛋白质一、二级结构为一体联合结构模型,并将上述信息囊括在其中.由该模型首先得到蛋白质一、二级结构的信息与统计特性,然后利用这些特性分别对蛋白质一、二级结构中各种变量的信息传递关系及隐Markov性进行定量分析和确切地统计描述.最后给出直接从一级结构出发预测二级结构的几个原则.

关键词：蛋白质一、二级结构的联合结构模型、三肽链、二级结构预测精度和覆盖率、隐Markov性

所属期刊栏目：20

分类号：O236(控制论、信息论（数学理论）)

资助基金：国家自然科学基金10271061;天南大联合研究项目;刘徽应用数学研究中心资助项目

在线出版日期：2003-11-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：117-124

英文信息展示

期刊专题