10.3969/j.issn.1002-137X.2009.03.054
基于模糊粗糙集的肿瘤分类特征基因选取
依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类剐的一组特征基因.粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因.由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取.然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验.以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性.
基因表达谱数据集、特征选取、粗糙集、模糊粗糙集、互信息
36
TP18(自动化基础理论)
国家自然科学基金项目60475019;国家自然科学基金重点项目60534060;国家重点基础研究发展计划973计划2003CB316902;2006年博士学科点专项科研基金20060247039
2009-04-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
196-200