10.11959/j.issn.1000-436x.2016038
MapReduce框架下支持差分隐私保护的k-means聚类方法
针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法.该算法利用MapReduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心的距离并标记其属于的聚类;指派Reducer分任务计算同一聚类中的记录数量num和属性向量之和sum,并利用Laplace机制产生的噪声扰动num和sum,进而实现隐私保护.根据差分隐私的组合特性,从理论角度证明整个算法满足ε-差分隐私保护.实验结果证明了该方法在提高隐私性和时效性的情况下,保证了较好的可用性.
数据挖掘、k-均值聚类、MapReduce、差分隐私保护、Laplace机制
37
TP301(计算技术、计算机技术)
国家自然科学基金资助项目61100042;总后军内科研基金资助项目No.AWS14R013The National Natural Science Foundation of China61100042;The Military Scientific Research Project of the General Logistics DepartmentAWS14R013
2016-05-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
124-130