10.3969/j.issn.1004-373X.2015.08.015
基于多视角特征融合与随机森林的蛋白质结晶预测
X射线晶体结构分析是测定蛋白质结构的重要方法之一,国际蛋白质数据库(PDB)中已知晶体结构的蛋白质80%~90%均是使用该方法得到的。然而,并不是所有的蛋白质都能良好结晶,使用晶体结构分析方法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的算法来对蛋白质能否结晶进行预测就具有重要意义。在此提出了一种组合蛋白质物理化学特性、序列信息与进化信息的蛋白质结晶预测方法。该方法从不同视角抽取分别抽取蛋白质的物理化学特征、伪氨基酸组成特征(PseAAC)和伪位置特异性得分矩阵特征(PsePSSM),使用随机森林对组合的特征进行蛋白质结晶预测。在标准数据集上的独立测试验证的结果表明,这里所述的蛋白质结晶预测方法具有良好的性能。
蛋白质结晶、伪氨基酸组成、位置特异性得分矩阵、随机森林
TN911-34
中央高校基本科研业务费专项资金30920130111010
2015-05-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
50-53