10.16452/j.cnki.sdkjzk.2019.01.010
集成特征选择方法在基因表达数据上的应用
基因表达数据的研究是生物医学上的一个重要课题.基于其高维度、小样本的特点,特征选择已经成为数据预处理阶段的关键步骤.单一特征选择方法得到的特征子集可能会有偏差,本研究在特征选择上引入集成学习的思想,构建集成特征选择模型,并将此模型应用到3个不同的基因表达数据集上.为了评价特征子集的分类预测性能,使用支持向量机作为分类器进行测试.实验结果表明:相对于单一的特征选择方法,集成特征选择能够有效提高分类模型准确度.
基因表达数据、特征选择、集成学习、支持向量机
38
C812(统计方法)
国家统计科学重点研究项目2014LZ41
2019-04-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
85-90