10.3969/j.issn.1001-4160.2010.05.003
1种蛋白质Loop片段结构的概率生成模型
在计算生物学中,根据蛋白质的氨基酸序列预测蛋白质的结构是尚未解决的重要问题之一,而其中的1个难点是预测蛋白质中Loop片段的结构.本文用1阶马尔可夫模型为基础,通过对其训练,可根据氨基酸串和2级结构信息为蛋白质Loop片段概率建模和采样.其中用Ramachandmn图示法的二面角对描述蛋白质结构,模型的训练和推理通过工具包Mocapy来完成.并使用KL交叉熵和角度差异值作为实验检验标准来完成Loop分布情况的测试实验,同时在从头预测Loop结构实验中预测CASP8中8个自由建模的蛋白质结构.与最流行的方法相比,本文提出的模型因为改进了Loop段的预测精度,从而可使得到的二面角对更加接近真实Loop结构中分布,同时在从头预测中提高整个蛋白质结构的预测精度.并且由于本文的模型具有概率推理特性,故在理论上也更具有无偏见性.
蛋白质Loop、1阶马尔可夫概率生成模型、双变量von Mises分布
27
O617;O6-39(无机化学)
国家自然科学基金项目60970055
2010-10-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
573-576