当前位置:主页 > 科技论文 > 软件论文 >

基于差分隐私保护的数据聚类相关研究

发布时间:2023-05-24 22:36
  聚类算法是数据挖掘中重要的算法,在多个应用领域中扮演着重要的角色。特别在服务质量(Quality of Service,QoS)预测框架中,服务聚类次数常用于衡量用户间的相似性;而在分类数据可视化中,聚类用于寻找数据集中合适的聚合点。随着互联网技术的迅速发展,带有敏感信息的数据迅速增长,这给广大用户的个人隐私带来很大的风险。围绕着聚类算法相关应用的隐私保护问题,已经引起学术界的广泛关注。差分隐私保护是近些年兴起的隐私保护方法,通过加入少量噪声,保障个体信息的隐私性,同时尽可能保证了数据的可用性。在服务质量预测中添加噪声扰动服务聚类次数,适当干扰相似用户的选择,避免用户个体的偏好的直接泄露。在分类数据可视化过程中,利用差分隐私机制添加噪声扰动聚类的迭代中心点,达到分类数据的隐私保护。为此,本文主要结合聚类算法,将差分隐私保护方法应用到服务质量预测和分类数据可视化过程中,并且通过隐私性分析和大量实验表明,新提出的方案在保护数据隐私的同时,能够有效地保证预测精确度,以及获得安全视图。主要的研究工作和贡献包括以下两个方面:(1)提出了一种基于差分隐私保护的服务质量预测算法,该算法的主要研究工具...

【文章页数】:82 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 服务推荐系统概述
    1.2 数据可视化概述
    1.3 国内外研究现状
        1.3.1 服务推荐系统与隐私保护
        1.3.2 数据可视化与隐私保护
    1.4 本文研究内容
    1.5 组织结构
第2章 基础知识
    2.1 聚类算法
        2.1.1 覆盖算法
        2.1.2 密度峰值聚类
        2.1.3 k-modes聚类
    2.2 差分隐私
        2.2.1 ε-差分隐私模型
        2.2.2 差分隐私的实现机制
    2.3 本章小结
第3章 基于差分隐私保护的服务质量预测算法
    3.1 引言
    3.2 服务质量预测算法及过程
    3.3 一种改进的覆盖算法
    3.4 差分隐私服务推荐系统设计
        3.4.1 隐私问题描述
        3.4.2 差分隐私保护服务推荐系统
        3.4.3 K个用户组合的效用优化方案
        3.4.4 隐私性分析
    3.5 实验分析
        3.5.1 数据集
        3.5.2 评价指标
        3.5.3 聚类算法对预测结果的影响
        3.5.4 矩阵密度对预测结果的影响
        3.5.5 Top-k对预测结果的影响
        3.5.6 隐私预算对预测结果的影响
    3.6 本章小结
第4章 一种满足差分隐私保护的分类数据可视化算法
    4.1 引言
    4.2 问题描述
    4.3 差分隐私保护分类数据聚合算法
    4.4 隐私性分析
        4.4.1 敏感度和隐私预算设定
        4.4.2 DPE k-modes隐私性证明
    4.5 实验分析
        4.5.1 分类数据集和评价指标
        4.5.2 隐私预算对聚类结果的影响
        4.5.3 k值对聚合运算的影响
    4.6 本章小结
第5章 总结与展望
    5.1 本文小结
    5.2 研究展望
参考文献
致谢
攻读硕士学位期间发表的学术成果
在读期间参加的科研项目



本文编号:3822415

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3822415.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户704b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com