随机森林的可解释性可视分析方法研究

引用

摘要：

由于随机森林算法在很多情况下都以"黑盒"的方式存在,对于用户而言,参数调整,训练甚至最终构建的模型细节是隐蔽的,这导致了随机森林模型的可解释性非常差,在一定程度上阻碍了该模型在一些诸如医学诊断、司法、安全领域等需要透明化和可解释需求比较高的领域使用.影响该模型可解释性挑战主要来源于特征选择和数据的随机性.同时随机森林包含许多决策树,用户很难理解和比较所有决策树的结构和属性.为了解决上述问题,设计并实现了可视分析系统FORESTVis,该系统包括树视图、部分依赖图、t-SNE投影图、特征视图等多个交互式可视化组件,借助该系统,相关研究人员和从业人员可以直观地了解随机森林的基本结构和工作机制,并协助用户对模型的性能进行评估.使用Kaggle公开数据集上进行案例分析,验证了该方法的可行性和有效性.

关键词：随机森林、可视分析、交互设计、可解释机器学习

所属期刊栏目：57

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61572344

在线出版日期：2021-03-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：168-175

英文信息展示

期刊专题