10.3778/j.issn.1002-8331.1712-0265
序列信息融合与两阶段特征选择的膜蛋白预测
膜蛋白的功能与其类型密切相关,因此膜蛋白类型的预测具有重要意义.针对膜蛋白特征表达过程中出现的特征维数高的问题,结合最大信息系数与遗传算法提出一种两阶段特征选择(MIC-GA).抽取膜蛋白序列信息中的伪氨基酸组成、二肽组成和位置特异性分数矩阵等特征融合后作为特征参数,并在融合过程中提出一种改进的ReliefF算法(FReliefF)得到更有效的特征分数.基于Stacking集成学习框架,两次使用极端随机树对膜蛋白类型进行合理化预测.结果表明该方法能够有效提高膜蛋白预测的准确率.
膜蛋白预测、最大信息系数、遗传算法、特征选择、特征融合、极端随机树
55
TP3(计算技术、计算机技术)
国家自然科学基金;云南省科技计划重点项目
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
145-150