新型适用于基因表达数据的模型聚类方法
针对EM算法中的初始类的数目很难决定,在迭代中经常产生部分最优的情况,将K-means算法与基于EM的聚类方法相结合,提出了一个新的适用于基因表达数据的模型聚类方法.新的聚类方法,首先利用K-means算法具有全局性、效率高的优点,快速得到聚类的起始类的划分,将其设置为高斯混合模型的初始参数值,进一步采用EM方法进行聚类,得到最优聚类结果.通过2次对真实数据集的实验测试,将新的算法分别与K均值算法和EM算法进行了比较.实验结果表明,新算法是一种有效的聚类方法,聚类结果的准确度得到了提高.
基因表达数据、K-means算法、EM聚类算法、生物信息学
32
TQ015.9;TP391.9;O6-39(一般性问题)
江苏省自然科学基金BK20130529;高等学校博士学科点专项科研基金资助课题20113227110010;江苏省博士后科研资助计划项目1202037C;中国博士后科学基金2013M541616
2015-04-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-74