10.3979/j.issn.1673-825X.2020.05.018
基于树模型的差分隐私保护算法
目前面向分类的差分隐私保护算法中,大部分都是基于决策树或者随机森林等树模型.若数据集中同时存在连续数据和离散数据时,算法往往会选择调用2次指数机制,并且进行隐私预算分配时往往选择平均分配.这都使得隐私预算过小、噪声过大、时间成本增加以及分类准确性降低.如何在保证数据隐私的同时尽可能地保证数据可用性,并提高算法性能,成为目前差分隐私保护技术研究的重点.提出了面向决策树和随机森林的2种差分隐私保护数据挖掘算法,使用Laplace机制来处理离散型特征,使用指数机制处理连续型特征,选择最佳分裂特征和分裂点,并采用最优特征选择策略和等差预算分配加噪策略.对金融数据集的测试结果表明,提出的基于树模型的差分隐私保护算法都能在保护数据隐私的同时,具有较高的分类准确性,并且能够充分利用隐私保护预算,节省了时间成本.
隐私保护、差分隐私、等差预算分配、决策树、随机森林
32
TP181(自动化基础理论)
国家重点研发计划2016YFB1000905
2020-10-20(万方平台首次上网日期,不代表论文的发表时间)
共9页
848-856