10.3969/j.issn.1001-3695.2014.03.044
基于信息增益比例约束的数据匿名方法及其评估机制
针对数据发布中的隐私泄露问题,分析了对数据集进行匿名保护需要满足的条件,提出了一种基于信息增益比例约束的数据匿名方法。该方法以凝聚层次聚类为基本原理,将数据集中的元组划分到若干个等价群中,然后概化每个等价群中的元组使其具有相同的准标志符值。在聚类过程中,以信息损失最小、信息增益比例最大的约束条件来控制聚类的合并,可以使数据匿名结果保持良好的可用性和安全性。对匿名结果的质量评估问题进行了深入的探讨,提出了匿名结果可用性和安全性的量化计算方法。在UCI知识库提供的Adult数据集上的一系列实验结果表明,该方法
数据匿名、凝聚层次聚类、信息增益、准标志符、数据发布
31
TP393(计算技术、计算机技术)
国家自然科学基金;教育部人文社会科学研究项目;中央高校基本科研业务费专项
2014-05-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
819-824