当前位置:主页 > 科技论文 > 软件论文 >

基于聚类的差分隐私保护的研究

发布时间:2023-06-27 23:35
  在大数据时代,各种类型数据的收集、存储、分析和发布变得简单便利,信息的传播速度也呈现出一种速度快、形态多、范围广的特性,大数据动和促进社会进步、经济增长的重要力量。然而,隐私信息一旦落入到非法入侵者手中,就可能会导致企业、政府和国家不可估量的损失。因此,在对数据进行发布、分析、挖掘的时候,需对数据进行隐私处理。差分隐私模型作为一种隐私保护的方法,其定义了一种非常严格的以最大背景知识作为它的攻击模型,在强大的背景知识和数学理论的支持下,通过向原始数据集内加入适量噪音参数ε从而进行数据保护。通过分析隐私保护数据挖掘技术(PPDM)——差分隐私保护下的传统K-means聚类算法可知,在聚类过程中隐私泄露的关键点在于无法正确的选择适合的聚类中心点进行隐私保护,由于数据集进行聚类划分时对选择聚簇点的要求不高,只通过聚类中心点的随机位置对数据进行保护,虽然这种传统的保护技术对数据安全性而言有一定的保护,但是,其聚类过程中初始点和中心点的选择具有一定的随意性和局限性,不仅降低了聚类的精确度和可用性,同时也使差分隐私模型的加噪结果失真。本文研究的主要内容是基于差分隐私保护下的聚类算法的改进,研究目的是...

【文章页数】:54 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 论文主要研究内容
    1.4 论文章节安排
2 基于差分隐私保护的数据挖掘技术
    2.1 隐私保护的概念
        2.1.1 隐私的定义
        2.1.2 隐私保护技术
    2.2 匿名化隐私保护技术
        2.2.1. K-anonymity模型
        2.2.2. L-diversity模型
    2.3 差分隐私基本概念
        2.3.1 差分隐私的定义
        2.3.2 隐私保护敏感度评测
    2.4 差分隐私的两种实现机制
        2.4.1 拉普拉斯机制
        2.4.2 指数机制
    2.5 差分隐私的保护框架
        2.5.1 交互式框架
        2.5.2 非交互式框架
    2.6 本章小结
3 一种基于聚类的差分隐私数据挖掘方法
    3.1 K-means聚类算法的改进
        3.1.1 K-means算法主要思想
        3.1.2 K-modes算法主要思想
        3.1.3 融合算法DPTK-means
    3.2 聚类评价指标
        3.2.1 F-measure评价指标
    3.3 一种基于聚类的差分隐私数据挖掘方法
        3.3.1 基于K-means的差分隐私算法
        3.3.2 基于DPTK-means的差分隐私算法
    3.4 本章小结
4 实验方案
    4.1 开发工具与开发技术
        4.1.1 实验环境
        4.1.2 实验数据集
        4.1.3 对比实验设计
    4.2 实验结果分析
        4.2.1 DPTK-means聚类算法的可行性分析
        4.2.2 差分隐私保护下的DPTK-means算法的安全性分析
    4.3 本章小结
5 总结与展望
参考文献
致谢
作者简介及读研期间主要科研成果



本文编号:3835552

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3835552.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户46977***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com