10.3969/j.issn.1000-565X.2013.12.017
用于基因芯片数据分析的模块性图聚类方法
图聚类是一种重要的聚类算法,可有效应用于蛋白质作用网络和芯片数据聚类等领域.文中针对现有基因芯片数据图聚类方法的不足,提出了一种基于模块性指标和子图平滑度的全局图聚类方法.为防止算法陷入局部最优解,引入子图平滑度的定义,打散每次聚类结果中产生的平滑度较低的子图,再对得到的单节点进行下一次聚类,经多次迭代后得到全局最优的聚类结果.采用一组基因组表达数据,将该方法和其他4种常用聚类方法(经典图聚类、k均值、SOM及Fuzzy算法)进行比较,结果表明:该方法在聚类过程中的平均类间重叠度和FOM′值总体上优于其他4种算法,在将数据集分类到最佳聚类数39时,其FOM′值分别比上述4种方法低28.41%、19.21%、9.84%和24.67%;其分类准确度高于Fuzzy法和SOM算法,算法执行效率则与SOM算法相近,比Fuzzy法高5.94%.
基因芯片、图聚类、模块性、平滑度、算法
Q811(生物工程学(生物技术))
教育部中国网格计划生物信息网格平台子项目B12137040130
2014-04-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
101-106