10.3969/j.issn.0258-8021.2022.02.006
基于深度级联森林的乳腺癌基因数据分类研究
乳腺癌基因数据的分类研究在临床医学上具有重要意义.针对基因数据的结构复杂、高维小样本等特点,提出一种最大相关最小条件冗余和深度级联森林结合的基因数据分类方法.选取博德基因研究所乳腺癌基因表达数据集,共98个数据作为样本,每个样本包含1 213个特征基因.首先对数据进行标准化处理,然后利用最大相关最小条件冗余选取特征子集,最后使用深度级联森林对特征子集进行分类.将随机森林、支持向量机和BP神经网络作为对比方法.结果表明,所提出的最大相关最小条件冗余和深度级联森林结合方法的最佳分类准确率达到93.78%,明显优于其他方法.该方法能有效提高乳腺癌基因数据的分类准确率,对基于基因数据的乳腺癌分类具有重要的理论意义与实用价值.
乳腺癌分类、基因表达数据、变量选择、最大相关最小冗余、深度级联森林
41
R318(医用一般科学)
国家自然科学基金;国家自然科学基金;吉林省教育厅科学研究项目;吉林省教育厅科学研究项目
2022-07-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
177-185