10.3969/j.issn.1000-3428.2017.04.027
一种增强的差分隐私数据发布算法
为在同等隐私保护强度下提高发布数据的分类准确率,在DiffGen算法基础上提出一种改进的差分隐私数据发布算法GiniDiff.该算法将原始数据集完全泛化,在每轮迭代中通过指数机制选择特化方案,并以构建决策树的方式将特化后的记录划归到新的等价类,使用拉普拉斯机制为等价类计数添加噪声并生成发布数据集.运用基尼系数增益衡量不同特化方案的可用性,合理分配隐私预算并动态计算其消耗,发布数据集的可用性得到有效提高.实验结果表明,该算法发布的数据在分类准确率方面优于DiffGen,接近理想水平.
差分隐私、数据发布、决策树、基尼系数增益、指数机制、拉普拉斯机制
43
TP309(计算技术、计算机技术)
国家自然科学基金61370220;河南省高校科技创新团队支持计划项目15IRTSTHN010;河南省科技攻关计划项目142102210425;河南省教育厅科学技术研究重点基础研究计划项目13A520240,14A520048;河南科技大学科研创新能力培育基金2013ZCX022
2017-05-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
160-165