机器学习中的隐私保护研究 ——基于门限秘密共享技术
发布时间:2021-01-29 22:15
机器学习算法是一种被广泛应用到实践中的高效数据挖掘技术,众多机器学习算法在大量数据的基础上创造了很多有价值的模型,解决了许多现实问题,例如数值预测、医疗诊断、图像分类,生物特征识别等等。历史留存和每日新增的大量数据通常包含许多敏感数据。因此,如何在不泄露敏感数据的前提下利用机器学习算法获取有价值的模型是一项亟需解决的有价值问题。线性回归算法、逻辑回归算法、神经网络算法是最具代表性的三种机器学习算法,它们在结构上属于递进关系,同时也是众多机器学习算法的基础。本文扩展了门限秘密共享方案、构建了完善的安全多方计算体系、将安全计算和三种机器学习算法结合构造了多数据源情形下能够确保门限隐私安全的机器学习算法。新的隐私保护方案赋予了机器学习算法门限隐私安全的特点。假设存在n个参与者,门限值设为t,门限隐私安全意味着算法能够在至多t个参与者被监听或者控制的情况下确保隐私安全,在至多n-t-1个参与者离线甚至被摧毁的情况下保证算法的正常运行。据已查阅的现有文献所知,在多数据源场景下本文首次提出了具有门限隐私安全特点的隐私保护机器学习算法。同时,我们也用C++语言实现了门限隐私保护的线性回归算法、门限隐...
【文章来源】:广州大学广东省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数
RELU函数
广州大学硕士学位论文46提下才可能向外提供自己的隐私数据,这将提高数据的使用门槛和数据共享难度。常见的机器学习应用场景通常包括多个数据提供者和需要预测服务的用户。数据提供者们希望联合训练出一个价值模型,用户希望借助此模型进行新数据的预测。在这一场景下,数据提供者的数据、训练出来的价值模型、需求预测服务的用户的隐私数据和预测结果均面临着隐私泄露风险。本文将利用前述的基于ES-TSSS的安全计算协议针对线性回归算法、逻辑回归算法和神经网络算法分别构建新的隐私保护协议,用于解决算法面临的隐私泄露问题。新的协议同样包含多个数据提供者,通常称为参与者。图5-1和图5-2描述了我们协议的整体框架。图5-1框架——训练阶段图5-1描述了训练过程,每个参与者将自己的带标签数据分别生成秘密分量并分发给全体参与者,然后所有参与者借助基于ES-TSSS的安全计算协议运行机器学习训练算法生成价值模型,价值模型最终将被分散存储在各个参与者手中。图中标注了需要保
【参考文献】:
期刊论文
[1]大数据安全与隐私保护[J]. 冯登国,张敏,李昊. 计算机学报. 2014(01)
本文编号:3007700
【文章来源】:广州大学广东省
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数
RELU函数
广州大学硕士学位论文46提下才可能向外提供自己的隐私数据,这将提高数据的使用门槛和数据共享难度。常见的机器学习应用场景通常包括多个数据提供者和需要预测服务的用户。数据提供者们希望联合训练出一个价值模型,用户希望借助此模型进行新数据的预测。在这一场景下,数据提供者的数据、训练出来的价值模型、需求预测服务的用户的隐私数据和预测结果均面临着隐私泄露风险。本文将利用前述的基于ES-TSSS的安全计算协议针对线性回归算法、逻辑回归算法和神经网络算法分别构建新的隐私保护协议,用于解决算法面临的隐私泄露问题。新的协议同样包含多个数据提供者,通常称为参与者。图5-1和图5-2描述了我们协议的整体框架。图5-1框架——训练阶段图5-1描述了训练过程,每个参与者将自己的带标签数据分别生成秘密分量并分发给全体参与者,然后所有参与者借助基于ES-TSSS的安全计算协议运行机器学习训练算法生成价值模型,价值模型最终将被分散存储在各个参与者手中。图中标注了需要保
【参考文献】:
期刊论文
[1]大数据安全与隐私保护[J]. 冯登国,张敏,李昊. 计算机学报. 2014(01)
本文编号:3007700
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3007700.html