10.3321/j.issn:0254-4164.2004.05.013
一种基于递归分类树的集成特征基因选择方法
利用DNA芯片基因表达谱信息识别疾病相关基因,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义.该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (Ensemble Feature Selection based on Recursive Partition-Tree).EFST可选择多组基于不同样本分布结构的特征基因,结合有监督机器学习中的多分类器集成(ensemble)决策技术,利用提出的衡量特征基因稳定性与显著性测度,集成各特征基因组选择最终的特征基因.应用结肠癌2000个基因的表达谱实验数据分析结果显示:EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力, 而且由支持向量机(SVM)等4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率.
基因表达谱、递归分类树、特征选择、集成决策
27
TP391(计算技术、计算机技术)
国家自然科学基金30370798,30170515;国家高技术研究发展计划863计划2003AA2Z2051,2002AA2Z2052;黑龙江省科技攻关项目GB03C602-4;黑龙江省自然科学基金F0177;国家"211"工程建设项目
2004-07-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
675-682