10.3969/j.issn.1000-7024.2014.12.053
基于随机森林的正例与未标注学习
为使用正例与未标注数据训练分类器(positive and unlabeled learning , PU learning),提出基于随机森林的PU学习算法。对POSC4.5算法进行扩展,在其生成决策树的过程中加入随机特征选择;在训练阶段,使用有放回抽样技术对PU数据集抽样,生成多个不同的PU训练集,并以其训练扩展后的 POSC4.5算法,构造多棵决策树;在分类阶段,采用多数投票策略集成各决策树输出。在 UCI数据集上的实验结果表明,该算法的分类性能优于偏置支持向量机算法、POS4.5算法和基于装袋技术的POSC4.5算法。
正例与未标注学习、决策树、随机森林、集成学习、偏置支持向量机
TP391(计算技术、计算机技术)
国家自然科学基金项目61303125
2015-01-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
4329-4334