10.11959/j.issn.1000−436x.2023007
面向非独立同分布数据的联邦学习数据增强方案
为了解决联邦学习节点间数据非独立同分布(non-IID)导致的模型精度不理想的问题,提出一种隐私保护的数据增强方案.首先,提出了面向联邦学习的数据增强框架,参与节点在本地生成虚拟样本并在节点间共享,有效缓解了训练过程中数据分布差异导致的模型偏移问题.其次,基于生成式对抗网络和差分隐私技术,设计了隐私保护的样本生成算法,在保证原数据隐私的前提下生成可用的虚拟样本.最后,提出了隐私保护的标签选取算法,保证虚拟样本的标签同样满足差分隐私.仿真结果表明,在多种non-IID数据划分策略下,所提方案均能有效提高模型精度并加快模型收敛,与基准方法相比,所提方案在极端non-IID场景下能取得25%以上的精度提升.
联邦学习、非独立同分布、生成式对抗网络、差分隐私、数据增强
44
TP301(计算技术、计算机技术)
国家重点研发计划;国家科技重大专项
2023-02-21(万方平台首次上网日期,不代表论文的发表时间)
共13页
164-176