10.3969/j.issn.1006-9348.2017.05.055
不可信任环境下敏感数据自动匿名方法仿真
针对目前多数匿名方法对敏感数据所有敏感属性值均作同等处理,没有考虑其敏感程度和具体分布情况,易受到相似性攻击和偏斜性攻击,导致信息损失较高的问题.提出一种基于频繁集发现的不可信任环境下敏感数据自动匿名方法.上述方法先对敏感数据属性所隐含的现实意义进行语义分析,计算敏感数据属性值之间的语义相似值和语义相异值,将准标识符中的属性分划为数值型属性和分类型属性两种类型,给出相应的敏感数据概化策略,计算出敏感数据集泛化信息损失,通过频繁集发现思想定义可考虑权重的敏感数据泛化匿名表效用度量函数,计算出所有敏感数据等价组加权信息量的平均值,由此完成不可信任环境下敏感数据自动匿名.实验结果表明,所提方法能够有效降低敏感数据泄露的风险概率,同时能够很好地降低实现自动匿名概化处理带来的信息损失.
不可信任环境、敏感数据、自动匿名方法
34
TP309(计算技术、计算机技术)
2017-06-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
257-260