10.3969/j.issn.0258-8021.2006.01.022
基于加权模糊k近邻方法的蛋白质亚细胞位点预测
蛋白质只有在特定的亚细胞位点(如细胞核、线粒体、细胞质等)才能参与正常的生命活动,因此蛋白质的亚细胞定位信息对于了解其功能有重要的意义.提出一种应用于蛋白亚细胞定位的多模糊k近邻加权投票算法.使用PSI-BLAST搜索得到的PSSM矩阵,以及1~7阶氨基酸对的信息作为输入特征,分别建立了8个模糊k近邻分类器,最后对所有分类器的结果使用加权投票得到最终预测结果.对包含四类亚细胞位置的RH-2427数据集进行jacknife测试,总预测精度达到88.1%,好于包括单一模糊k近邻在内的多种其它预测方法.同时,该方法可以方便地扩展到对包含叶绿体、高尔基体、溶酶体等更多类亚细胞位点的预测.
模糊k近邻、投票算法、亚细胞定位、生物信息学
25
Q617(理论生物物理学)
中国科学院科研项目
2006-05-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
106-109