10.3778/j.issn.1673-9418.1705031
基于遗传算法的蛋白质复合物识别算法
蛋白质互作用网络是一种典型的复杂网络,呈现了明显的社区结构.网络中的社区对应于功能模块,通常被看作蛋白质复合物.蛋白质复合物识别对预测蛋白质功能,解释特定生物进程具有重要作用.基于种子节点扩展的图聚类方法在蛋白质复合物识别中应用广泛.针对此类算法最终结果受种子节点的影响较大,并且在簇的形成过程中搜索空间有限等问题,提出了一种基于遗传算法的蛋白质复合物识别算法GAGC(ge-netic algorithm based graph clustering),其中个体表示聚类结果(类别之间可能存在重叠节点),以F-measure值作为种群进化的目标函数.算法采用IPCA(improvement development clustering algorithm)算法产生初始种群;针对初始种群,设计了染色体对齐方式以进行交叉操作产生下一代种群.通过与DPClus、MCODE、IPCA、ClusterOne、HC-PIN、CFinder等经典算法的对比实验表明,GAGC算法能够扩大图聚类算法的搜索空间,提高解的多样性,进而提高蛋白质复合物检测的性能.
蛋白质互作用网络、遗传算法、图聚类、蛋白质复合物
12
TP391(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant Nos.61272004,61572005
2018-06-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
794-803