面向网络搜索日志的发布方法研究
搜索日志分析是数据挖掘和机器学习的重要研究内容,网络搜索日志中的隐私数据安全成为当前面临的重大挑战,提出一种分类匿名化技术与差分隐私相结合的搜索日志匿名化发布方法.首先,将k-匿名的思想与分类匿名化技术扩展到聚类方法中,分类概化准标识属性引导形成簇,所提出的查询项相似度计算方法有效改善聚类精度;其次,在簇中分别添加指数噪音数据,且使发布的数据满足差分隐私保护;最后发布处理后的数据.实验表明:该方法有效地防止搜索日志中敏感信息泄露,并提高了数据的实用性.
差分隐私、隐私保护、网络搜索日志、数据发布、分类技术
2
TP312(计算技术、计算机技术)
北京市社会科学基金项目15JGB099;北京市优秀人才培养资助项目2013E005007000001;国家自然科学基金项目61370139
2016-10-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
251-257