【目的】 本地化差分隐私是优秀的隐私保护模型,能够在数据共享、发布的场景下对群体进行统计分析,保护个人数据隐私。本文围绕本地化差分隐私进行综述,为未来工作提供参考。【文献范围】 本文调研了来自主流会议、期刊的本地化差分隐私领域的论文,并进行了总结归纳。【方法】 本文以数据统计分析任务类型为线索,从基于本地化差分隐私模型的频率估计、均值估计、多维数据统计分析和机器学习4个方面展开调研。本文对相关研究进行了对比分析,对关键问题进行了总结,对现有工作的不足进行了讨论,对未来的研究方向进行了展望。【结果】 本地化差分隐私模型能够在用户数据被采集、分析时,为用户个人数据隐私提供强有力的隐私保护。【局限】 本文以数据统计分析任务类型为线索,未对图数据相关研究进行总结。【结论】 本地化差分隐私作为一种优秀的隐私保护模型,得到学者们的关注后迅速发展,但是仍然面临着诸多问题和挑战,值得进一步研究和探索。
分析任务 | 典型机制 | 关键技术 | 优点 | 缺点 |
频繁项挖掘 | LDPMiner[ | 填充采样;修正候选集合 | 采样避免隐私预算的分割 频率统计和频繁项集合的确定 二者分离 | 不适用 |
PEM[ | 构建前缀树;用户分组 | 计算开销小 | 隐私预算划分降低数据可用性 | |
PrivSet[ | 填充采样;子集选择 | 估计结果误差小 | 子集大小的确定不高效 | |
Calibrate[ | 利用先验知识 | 根据先验知识建模减小误差 | 增大了计算开销 | |
GFIM[ | 候选集合去冗余; 用户分组 | 减小候选集,降低时间复杂度 | 增大了计算开销 | |
IC[ | 子域分割;交互的FRR | 通信成本低 | 采样方法降低数据可用性 | |
频繁项集挖掘 | SVSM[ | GRR;OLH;猜测概率 | 可以选择频率估计机制 减小候选集 | 猜测概率引入额外的误差 |
Ma’s[ | HRR;FP-tree | 通信开销小 | 增大了计算开销 | |
Priv_OA[ | 两级随机化技术 | 考虑了数据项之间的关联性 | 不适用 | |
LDP-FPMiner[ | GRR;OLH;FP-tree | 考虑了数据项集之间的关联性 | 没有讨论用户分组大小 |
