融合PPI网络和基因表达的复合物识别算法
从大规模相互作用网络中识别蛋白质复合物,对解释特定的生物进程和预测蛋白质功能具有重要作用,同时也是后基因组时代一个最重要的研究课题.考虑到传统仅基于蛋白质相互作用网络(PPI网络)的蛋白质复合物识别算法可靠性不高,本文提出了一种新的融合PPI网络和基因表达数据的蛋白质复合物识别算法IPCIPG.区别于之前用基因表达数据评估PPI网络可靠性的做法,本文提出在蛋白质复合物的识别过程中将PPI网络和基因表达数据有机地结合起来.算法IPCIPG首先根据边聚集系数(ECC)与蛋白质间共表达的相关性(PCC)计算PPI网络中每个节点的权重,权重最大的节点作为种子,然后从种子节点开始扩充生成稠密子图.基于酵母数据集的实验结果表明,算法IPCIPG较其他算法HUNTER,HC-PIN,CMC,SPICI,MOCDE,MCL能够更准确,更有效地识别出具有特定生物意义的蛋白质复合物.
系统生物学、蛋白质相互作用网络、蛋白质复合物、基因表达数据
34
TP391(计算技术、计算机技术)
国家自然科学基金61003124,61370024;教育部新世纪优秀人才支持计划NCET-12-0547
2014-03-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
437-443