10.11772/j.issn.1001-9081.2021101724
面向本地差分隐私的K-Prototypes聚类方法
为了在聚类分析中保护数据隐私的同时确保数据的可用性,提出一种基于本地化差分隐私(LDP)技术的隐私保护聚类方案——LDPK-Prototypes.首先,用户对混合型数据集进行编码;其次,采用随机响应机制对敏感数据进行扰动,而第三方在收集到用户的扰动数据后以最大限度恢复原始数据集;然后,执行K-Prototypes聚类算法,在聚类过程中,使用相异性度量方法确定初始聚类中心,并利用熵权法重新定义新的距离计算公式.理论分析和实验结果表明,所提方案与基于中心化差分隐私(CDP)技术的ODPC算法相比,在Adult和Heart数据集上的平均准确率分别提高了2.95%和12.41%,有效提高了聚类的可用性.同时,LDPK-Prototypes扩大了数据之间的差异性,有效避免了局部最优,提高了聚类算法的稳定性.
本地化差分隐私、K-Prototypes、随机响应机制、熵权法、隐私保护
42
TP309(计算技术、计算机技术)
国家自然科学基金U20A20179
2022-12-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
3813-3821