当前位置:主页 > 科技论文 > 自动化论文 >

基于强化学习的隐私数据定价研究

发布时间:2020-10-13 09:50
   随着互联网、物联网、云计算等信息技术的发展和普及,全球数据量呈爆炸式增长。在大数据时代下,个人信息的价值受到日益广泛的重视,在探寻数据中所蕴藏的巨大的经济效益和社会效益的同时,如何科学地平衡数据价值开发和个人隐私安全,是近年来学术界持续研究和努力解决的重点问题。为解决大数据与个人隐私的冲突,一种可行的途径是建立数据交易平台。而数据交易的关键在于合理设定数据的价格。由于数据提供者与收集者之间的“信息非对称”,当前学者在提出数据交易机制时均假定了个人对隐私的重视程度所服从的概率分布是数据收集者已知的。但事实上,“概率分布己知”这一假设在现实中很难成立,因而有必要研究概率分布未知情况下的数据交易机制。首先,本文以实现数据价值与隐私安全的平衡为目标,对数据交易场景中数据提供者及数据收集者之间的交互进行建模分析,提出了基于用户角色的分析方法,分别对数据提供者及数据收集者在隐私数据交易过程中所面临的问题进行分析梳理。在明确交易场景及模型需求之后,设计并提出了基于多状态选择的隐私数据动态定价模型。该模型的构建由“隐私定价”、“多状态选择”以及“时变收益”三个环节组成。其中,为保障交易过程中数据提供者的隐私安全,模型采用k-匿名技术对购买到的数据进行匿名化处理。如何在模型中体现匿名化处理对数据价值的影响,这是本模型解决的重点问题之一。其次,为求解概率分布未知情况下的数据交易最优定价策略,结合所构建的基于多状态选择的隐私数据动态定价模型,本文在强化学习思想的基础之上,提出了基于经验矩阵的定价策略学习算法PriSARSA及PriQ-learning算法。通过运用PriSARSA及PriQ-learning算法,数据收集者可以不断的与数据提供者进行交互来获取出价经验,并从给予的奖赏信号中获得知识,以不断改进原有的行动策略来获得更高的回报,最终使累积总收益值最大化。为评估所提定价策略算法的性能,本文对其进行了仿真实验。仿真结果表明,所提出的基于经验矩阵的定价策略学习算法不仅可以求解概率分布未知情况下的定价决策问题,更可以依据“经验矩阵”做出最优的定价判断,为数据收集者带来高收益。最后,由于强化学习迭代求解过程较为耗时,可以利用启发式学习思想,通过增加启发函数来改善策略算法,使得算法的学习速度得以加快。本文在基于经验矩阵的定价策略算法基础之上,对PriQ-learning算法进行改进和优化,提出了基于启发函数的定价策略算法。启发式PriQ-learning算法通过在原有的策略算法中设计并增加启发式奖赏函数及启发式策略选择函数,以此来指导数据收集者的定价行为,加快了定价策略算法的学习速度,提高了算法性能。本文通过对多种定价策略算法进行仿真测试,验证了所提算法的高性能。仿真结果证实了启发式PriQ-learning算法能够帮助数据收集者在有限的隐私数据交易过程中获得更高的收益回报。
【学位单位】:北京邮电大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP309;TP181
【部分图文】:

新闻


1.1课题背景及意乂??1.1.1研究背景??进入21世纪以来,伴随着互联网时代的发展和进步,全球的数据量呈飞式地增长,人类社会己步入大数据时代[1]。由个人创建的或蕴含着个人信息的据,称为个人数据。个人数据是构成大数据的基础性资源,没有个人数据的支撑,??大数据无从谈起。合理运用个人数据可创造巨大的社会和经济效用[2]。例如,过综合分析互联网用户在使用在线购物、检索资料、网络社交等服务时生成的量行为和内容数据,企业可构建出互联网用户的画像,进而针对用户制定个性的营销策略;通过监控统计用户出行过程中记录在行车记录仪等智能终端中的据,政府可以针对交通拥堵问题进行有效的解决[3]。在大数据时代,个人数据誉为“网络中的黄金”?[4]。??

个人信息,政府,技术,个人隐私


0.00%?10.00%?20.00%?30.00%?40.00%?50.00%?60.00%??图1?-2政府类爬虫分布??从图1-1和1-2中可以看出,个人数据、个人信息早已在网络中被各类爬虫??技术盯上。其中,出行、社交以及电商类数据是被挖掘利用的重灾区。在大数据??时代,人类的生产生活都离不开个人数据的参与。人们依托着海量的数据,享受??着智能识别、个性化推荐等技术给生活带来的便捷,与此同时带来的是个人数据??的隐私安全问题。??个人隐私是当事人不希望被他人所知的个人信息或者不愿被他人进入的个??人空间的总和。而个人数据与用户日常活动紧密联系,比如移动轨迹、消费记录、??社交信息等,因而或多或少地反映了个人隐私。2013年,“棱镜门”事件爆发,??美国政府擅自无视公民隐私权,收集与恐怖主义有关的信息,引起美国公民的不??满。而在不久之后,另一起大规模的隐私数据泄露又被爆出,一家数据分析企业??窃取了?Facebook上多达5000万的用户信息

机器学习,无监督学习,监督学习


习是一门跨领域的学科,涉及心理学、仿生学、统计学和计算。它是机器学习的重要组成部分之一,除此之外机器学习还包督学习[22]。??学习思想概述??等哺乳动物由于可以在与环境的交互过程中学习经验,总结规能,因此能够通过不断地探索环境、学习环境的变化,以此增从而对自我的行为决策做出更好的判断。机器学习作为人工智研宄课题,能够赋予计算机学习的能力,并仿真或指导人类生为决策。当人类需要花费漫长的时间学习才能实现理想的效果有学习速度快、效率高的优点,且只需要一个机器学会,其余靠复制它的程序实现该功能;除此之外,人类学习会因生命终学习则不局限于这一点,因此可以获得更高的知识积累。??
【相似文献】

相关期刊论文 前10条

1 陶林波;沈建京;薛猛;蔡立刚;;云计算环境下隐私数据的隐式攻击保护[J];计算机科学;2016年09期

2 顾理平;杨苗;;个人隐私数据“二次使用”中的边界[J];新闻与传播研究;2016年09期

3 肖治庭;任毅;;面向数据库应用的隐私数据模型研究[J];计算机与数字工程;2013年08期

4 ;怎样彻底删除隐私数据[J];计算机与网络;2009年20期

5 裴华艳;王焕民;;基于可信计算的多租户隐私数据保护[J];计算机系统应用;2015年10期

6 曲家兴;姜天一;燕思嘉;苍鹤;;RFID系统隐私保护技术探讨[J];信息技术;2011年07期

7 张宏壮;刘明生;王建民;;一种高效保持隐私数据挖掘协议的实现[J];河北省科学院学报;2007年01期

8 米铁男;;中国电子商务领域隐私数据保护研究[J];学术交流;2013年07期

9 侯翔;;隐私数据的用户自我保护策略综述[J];四川文理学院学报;2010年05期

10 刘逸敏;程传苗;邢茂迎;;隐私数据保护技术在医院信息管理领域应用探讨[J];中国数字医学;2008年07期


相关博士学位论文 前6条

1 施炎峰;面向云平台隐私数据保护的加密技术研究[D];北京交通大学;2015年

2 刘逸敏;基于访问目的的隐私数据访问控制机制研究[D];复旦大学;2012年

3 王俊;面向健康服务的可穿戴设备安全认证与隐私数据发布[D];武汉大学;2017年

4 王保卫;无线传感器网络隐私数据安全研究[D];湖南大学;2011年

5 洪双喜;Android平台隐私保护方法研究[D];北京邮电大学;2017年

6 赵考;面向智能移动终端的隐私保护技术研究[D];华中科技大学;2016年


相关硕士学位论文 前10条

1 陈希;基于强化学习的隐私数据定价研究[D];北京邮电大学;2019年

2 谭江平;企业网站隐私数据保护技术研究[D];河北大学;2018年

3 张国放;基于访问控制的TaintDroid隐私数据保护研究[D];西安电子科技大学;2018年

4 张克落;物流用户隐私数据保护和访问权限管理研究[D];东南大学;2018年

5 梁辰;基于匿名化的隐私数据保护模型研究[D];北京邮电大学;2018年

6 向东东;基于用户行为特征的手机端身份识别研究[D];上海师范大学;2018年

7 孙涛;云环境中隐私数据保护软件的设计与实现[D];广西大学;2015年

8 周长利;物联网隐私数据保护策略研究[D];哈尔滨工程大学;2012年

9 程旋;PDF中隐私数据的保护方法研究[D];武汉工程大学;2017年

10 汤瑾;Android平台下的隐私数据保护方法的研究与实现[D];北京邮电大学;2014年



本文编号:2839022

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2839022.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2f8fc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com