10.16798/j.issn.1003-0530.2020.01.014
数据集类别不平衡性对迁移学习的影响分析
数据集类别不平衡性是机器学习领域的常见问题,对迁移学习也不例外.本文针对迁移学习下数据集类别不平衡性的影响研究不足的问题,重点研究了以下几种不平衡性处理方法对迁移学习的影响效果分析:过采样、欠采样、加权随机采样、加权交叉熵损失函数、Focal Loss函数和基于元学习的L2RW(Learning to Reweight)算法.其中,前三种方法通过随机采样消除数据集的不平衡性,加权交叉熵损失函数和Focal Loss函数通过调整传统分类算法的损失函数以适应不平衡数据集的训练,L2RW算法则采用元学习机制动态调整样本权重以实现更好的泛化能力.大量实验结果表明,在上述各种不平衡性处理方法中,过采样处理和加权随机采样处理更适合迁移学习.
迁移学习、不平衡数据分类、深度神经网络、重采样
36
TP391(计算技术、计算机技术)
国家自然科学基金61372123,61701252
2020-06-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
110-117