基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因
动脉粥样硬化是因脂质堆积在血管壁上并受到多种遗传和环境因素影响的一种复杂的病理生理疾病.动脉粥样硬化风险疾病基因的辨识可以增进对该疾病机理的了解,并对该疾病的诊断和治疗起到指导性作用.虽然在风险疾病基因的辨识方面已经提出了很多计算方法,但仍存在着推论准确性和计算效率方面的问题.一种命名为基于熵聚类和双重筛选(Entropy-based clustering and double screening,ECDS)的新方法被用来辨识该疾病的风险疾病基因.该方法将功能基因组信息和蛋白质相互作用网络拓扑结构信息进行整合,运用于基于熵聚类的方法中,之后,使用双重筛选策略(即支持向量机和相似性得分)进行风险疾病基因挖掘.运用该方法,从巨噬细胞样本和泡沫细胞样本中分别辨识出79个和113个风险疾病基因.该结果表明ECDS在辨识动脉粥样硬化风险疾病基因方面非常有效.此外,该方法也很易于扩展应用到其它复杂疾病的风险基因辨识中.
动脉粥样硬化、基于熵聚类、风险疾病基因、相似性得分、支持向量机
30
R318.04;Q78(医用一般科学)
grants from The National Natural Science Foundation of China61170134,60775012;The Doctorate Foundation of Northwestern Polytechnical Universitycx201017;国家自然科学基金项目61170134,60775012;西北工业大学博士基金项目cx201017
2014-05-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
63-71