面向非独立同分布数据的联邦学习数据增强方案

引用

摘要：

为了解决联邦学习节点间数据非独立同分布(non-IID)导致的模型精度不理想的问题,提出一种隐私保护的数据增强方案.首先,提出了面向联邦学习的数据增强框架,参与节点在本地生成虚拟样本并在节点间共享,有效缓解了训练过程中数据分布差异导致的模型偏移问题.其次,基于生成式对抗网络和差分隐私技术,设计了隐私保护的样本生成算法,在保证原数据隐私的前提下生成可用的虚拟样本.最后,提出了隐私保护的标签选取算法,保证虚拟样本的标签同样满足差分隐私.仿真结果表明,在多种non-IID数据划分策略下,所提方案均能有效提高模型精度并加快模型收敛,与基准方法相比,所提方案在极端non-IID场景下能取得25％以上的精度提升.

关键词：联邦学习、非独立同分布、生成式对抗网络、差分隐私、数据增强

所属期刊栏目：44

分类号：TP301(计算技术、计算机技术)

资助基金：国家重点研发计划;国家科技重大专项

在线出版日期：2023-02-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：164-176

英文信息展示

期刊专题