10.20009/j.cnki.21-1106/TP.2021-0001
一种基于加权深度森林的离群数据挖掘算法
深度森林是一种有效的机器学习方法,但在级联森林模块中,森林中子树的特征选择随机性较大,使用传统的平均值法可能导致森林的预测概率存在一定误差,从而影响整个算法性能.针对以上问题,提出了一种基于加权深度森林离群数据挖掘算法(Weight Deep Forest,WDF).首先,通过森林的预测概率定义权重因子μ,描述当前层森林准确率大小;其次,在级联森林模块的构建过程中,把权重因子μ作为级联层中每个森林的权重,从而降低森林中根节点特征的随机选择对算法性能的影响;根据数据样本分布的不同,通过计算其类密度重新定义了局部孤立因子α,描述数据离群程度大小;最后利用UCI数据集以及LAMOST光谱数据对算法进行验证,结果表明该算法与同类算法相比在离群点检测方面具有更高的挖掘质量.
深度森林、级联森林、权重因子、孤立因子、离群挖掘
43
TP311(计算技术、计算机技术)
国家自然科学基金;山西省重点研发项目;山西省重点研发项目
2022-07-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
1426-1431