10.3969/j.issn.1003-3254.2018.02.030
基于多重进化矩阵的蛋白质特征向量构造方法
特征向量的构造是蛋白质二级结构预测的一个关键间题. 现有的研究方法, 通常只使用BLOSUM62进化矩阵生成PSSM矩阵, 对蛋白质进化过程中存在的氨基酸残基突变现象缺乏考虑. 本文提出利用多重进化矩阵构造蛋白质特征向量, 其融合了不同进化时间的PSSM矩阵, 不仅能够很好地反映序列中氨基酸的位置信息, 而且能够反映序列进化过程中氨基酸位点发生突变产生的影响. 本文通过组合不同进化程度的矩阵来构造特征向量, 选用逻辑回归、随机森林和多分类支持向量机三种分类算法作为预测工具, 利用网格搜索法和交叉实验法优化参数, 在RS126、CB513和25PDB公用数据集上进行了若干组实验. 对比实验结果表明, 本文所提出基于多重进化矩阵的蛋白质特征向量构造方法能够有效提高蛋白质二级结构的预测精度.
蛋白质结构预测、多重进化矩阵、逻辑回归、随机森林、多分类支持向量机
27
国家自然科学基金61375013,61502259;山东省自然科学基金ZR2013FM020
2018-03-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
180-185