基于可解释性分析的深度神经网络优化方法

引用

摘要：

近年来,深度神经网络(deep neural network,DNN)在众多领域取得了广泛应用,甚至在安全关键系统中已经可以代替人类作出决策,如自动驾驶和智慧医疗等,这对DNN的可靠性提出了更高的要求.由于DNN具有复杂的多层非线性网络结构,难以理解其内部预测机制,也很难对其进行调试.现有的DNN调试工作主要通过修改DNN的参数和扩增数据集提升DNN性能,以达到优化的目的.然而直接调整参数难以控制修改的幅度,甚至使模型失去对训练数据的拟合能力;而无指导地扩增训练数据则会大幅增加训练成本.针对此问题,提出了一种基于可解释性分析的DNN优化方法(optimizing DNN based on interpretability analysis,OptDIA).对DNN的训练过程及决策行为进行解释分析,根据解释分析结果,将原始数据中对DNN决策行为产生不同程度影响的部分以不同概率进行数据变换以生成新训练数据,并重训练DNN,以提升模型性能达到优化DNN的目的.在使用 3个数据集训练的 9个DNN模型上的实验结果表明,OptDIA可以将DNN的准确率提升0.39～2.15个百分点,F1-score提升0.11～2.03个百分点.

关键词：深度神经网络、DNN优化、DNN缺陷、DNN性能、可解释性分析

所属期刊栏目：61

分类号：TP311.5(计算技术、计算机技术)

在线出版日期：2024-01-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：209-220

英文信息展示

期刊专题