蛋白质折叠速率数据集的构建及分析
近年来,随着高精度的蛋白质折叠速率实验数据的不断积累,使得从蛋白质折叠速率角度研究蛋白质折叠机制的理论工作者,迎来了前所未有的机遇和挑战.然而,却有约100多个蛋白质的折叠速率实验数据散落在2个数据库和若干文献中.为了方便今后的理论工作分析,作者将这些散落数据汇集整理出来,构建了一个包含109个非冗余单体野生型蛋白质的折叠速率数据集,称为PFRD109 (protein folding rate dataset 109).PFRD 109所包含的109个蛋白质中,有69个二态蛋白和40个多态蛋白,折叠速率从10-4到106 s-1,跨度为10个数量级.链长最短的为16aa,最长为390aa,二态蛋白平均长度为78 aa,多态蛋白平均长度为137aa.当前,生物信息学对蛋白质折叠速率的研究,主要集中于寻找与折叠速率和折叠动力学相关的各种生化参数或拓扑参数,进而实现对蛋白质折叠速率和蛋白质折叠动力学类型的预测.因此,本文还针对PFRD109数据集,就这两个方面进行了一些参数的统计分析.
蛋白质折叠速率、数据集、统计分析
28
Q615;Q7(理论生物物理学)
内蒙古自治区自然科学基金项目2010BS0104
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)
509-519