10.16208/j.issn1000-7024.2018.02.048
基于LPP-RF的基因表达数据分类
为提高随机森林算法在基因表达数据分类方面的性能,提出基于局部保持映射的随机森林算法.对每棵决策树的所有节点,通过局部保持映射,将节点数据映射到新的属性空间中,选取第一个属性为最佳分裂属性.与传统随机森林算法相比,该算法缩短了决策树的构建时间,增加了决策树之间的差异性,明显提高了分类准确率.在9个标准基因表达数据集的对比实验结果表明,该算法性能优于传统随机森林算法,对基因表达数据中类不平衡导致正类样本准确率低的问题有一定改善.
随机森林、决策树、基因表达数据、局部保持映射、分类
39
TP391(计算技术、计算机技术)
2018-05-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
563-569