10.3969/j.issn.1000-6788.2012.04.018
基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用
随机森林被广泛应用于包括癌症诊断在内的生物信息学领域.从自适应k近邻的角度分析了随机森林的分类机理,分析其存在的信息损失,据此提出一种新的投票机制,称为基于随机森林的潜在k近邻算法RF-PN,铠够充分利用决策树上的OOB样本信息,显著改善随机森林的分类性能.6个癌症基因表达数据集上的对比实验表明,RF-PN的分类准确率优于原算法.
随机森林、潜在k近邻、基因表达数据
32
TP311(计算技术、计算机技术)
国家自然科学基金60975052;中央高校基本科研业务费专项资金2010121065
2012-08-27(万方平台首次上网日期,不代表论文的发表时间)
共11页
815-825