10.3969/j.issn.1673-629X.2017.07.026
一种基于决策树的隐私保护数据流分类算法
隐私保护的决策树挖掘方法主要是基于数据扰动的方法和基于安全多方计算的方法.由于数据流高速、连续无限和动态的特性,这些隐私保护方法在数据流挖掘应用上有所不足.针对当前数据流挖掘应用中的隐私泄露问题,提出了一种基于决策树的隐私保护的数据流分类算法-PPFDT.该算法通过采用添加随机噪声的方法对数据加以隐私保护,改进经典的数据流挖掘算法-VFDT,并使用阈值算法找到扰动数据流的最佳分裂属性和最佳分裂点,从而直接在扰动数据流上建立决策树,通过使用该决策树对初始数据流和扰动数据流分类得到较精准的结果.从PPFDT算法的隐私保护程度和在直接扰动的数据流上的分类性能两方面,基于UCI的WaveForm数据集进行了实验验证.实验结果表明,该算法在数据流上快速准确分类的同时,具有一定的隐私保护程度.
决策树、隐私保护、数据流、分类
27
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61302158,61571238
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
111-114,119