10.7685/j.issn.1000-2030.2014.06.001
基因表达数据聚类分析方法的比较
通过生物信息学分析方法,利用广泛使用的基因芯片技术产生的数万个基因表达数据,揭示基因的功能和相互作用.聚类分析是一种主要的生物信息学分析方法,能高效发掘功能一致的基因.针对基因表达谱聚类分析方法较多、应用者选择方法困难的问题,本研究利用3组基因表达谱模拟数据和1组酵母菌基因表达实际数据,通过Cali(n)ski-Harabasz指数、灵敏值和分类正确率3个指标,比较了平滑样条聚类、数量性状关联聚类和局部逼近模糊聚类法3种经典方法.结果表明:平滑样条聚类法的Cali(n)ski-Harabasz指数平均数最大,灵敏值平均数最小,分类正确率最大,为最优方法;数量性状关联聚类次之,局部逼近模糊聚类最差.这一结果为今后基因表达谱数据聚类分析方法选择提供了参考依据.
聚类分析、Cali(n)ski-Harabasz指数、灵敏值、分类正确率、基因表达谱
37
Q348(遗传学分支学科)
中央高校基本科研业务费青年基金项目KJQN201414;国家自然科学基金青年基金项目31301229
2015-01-07(万方平台首次上网日期,不代表论文的发表时间)
1-6