基于改进随机森林算法的文本分类研究与应用
传统随机森林分类算法采用平均多数投票规则不能区分强弱分类器,而且算法中超参数的取值需要调节优化.在研究了随机森林算法在文本分类中的应用技术及其优缺点的基础上对其进行改进,一方面对投票方法进行优化,结合决策树的分类效果和预测概率进行加权投票,另一方面提出一种结合随机搜索和网格搜索的算法对超参数调节优化.Python环境下的实验结果表明本文方法在文本分类上具有良好的性能.
随机森林、文本分类、加权投票、超参数优化、随机搜索、网格搜索
28
2019-06-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
220-225