当前位置:主页 > 科技论文 > 软件论文 >

事务型数据流发布的隐私保护方法研究

发布时间:2018-08-07 10:53
【摘要】:近年来,随着网络信息技术的快速发展及其在人们生活中的应用,使得互联网中产生了大量的数据,这些数据包含大量信息,商业机构、政府部门可以利用这些数据来进行商业决策、科学研究等。因此数据共享变得非常有必要,然而这些数据包含了大量的个人敏感信息,如果数据拥有者发布这些数据前不做适当处理就有可能使得个体的隐私信息泄露,从而给个体带来危害。因此,数据发布中的隐私保护问题成为当前研究的热点。该问题研究如何对数据进行处理使得发布的数据不泄露个体隐私的同时具有较高的可用性。目前数据发布中的隐私保护技术大都是基于静态数据集的。随着物联网的推广以及大数据时代的到来,网络点击数据、电话呼叫记录、大型超市的购物数据等通常表现为动态变化的数据流,数据流具有海量性、实时性和动态变化性。传统的隐私保护技术不适用于数据流环境中。事务型数据流是数据流的一种普遍形式,如商场的购物数据等,其中每条记录是由项目组成的集合。这种数据通常包含用户的敏感信息。目前数据流发布中的隐私保护方法主要针对关系型数据流。事务型数据流具有高维和稀疏的特性,使得用于处理关系型数据流的隐私保护技术也不能直接适用于事务型数据流;事务型数据流具有实时和动态变化性,使得传统的处理静态事务型数据的隐私保护方法不能直接应用于数据流环境。本文研究事务型数据流发布的隐私保护问题,提出了基于滑动窗口的事务型数据流发布的隐私保护方法。主要研究工作如下:首先,结合滑动窗口和ρ-不确定性隐私保护模型,提出基于滑动窗口的ρ-不确定性模型,即要求任一滑动窗口都满足ρ-不确定性。当新数据的到达和旧数据的删除使滑动窗口内的数据不断更新而导致滑动窗口不再满足隐私要求时,本文分析了删除子窗口和添加子窗口对滑动窗口的影响,同时给出了信息损失度量方法。其次,根据删除子窗口和添加子窗口建立受影响的关联规则树,从而快速找出造成当前窗口不满足ρ-不确定性隐私要求的敏感关联规则,利用抑制方法选择尽可能少的项目进行删除使得当前窗口满足ρ-不确定性。为了减少数据的信息损失,本文进一步提出了抑制和概化相结合的方法,根据信息损失度量来判断选择将项目删除还是概化使得当前窗口达到隐私要求。最后,给出了系统的设计方案以及各模块的详细实现过程。从数据匿名的效率和数据的效用性两个方面,对本文提出的方法与直接利用静态事务型数据匿名方法进行比较,实验结果表明,本文的方法能快速匿名,同时能有效地保证数据的效用性。
[Abstract]:In recent years, with the rapid development of network information technology and its application in people's lives, the Internet has produced a lot of data, which contains a lot of information, business organizations, Government departments can use the data for business decisions, scientific research, and so on. Data sharing is therefore necessary, but the data contains a large amount of personal sensitive information, and if the data owner does not properly handle the data before releasing it, it may cause the privacy information of the individual to be leaked. Thus bring harm to the individual. Therefore, privacy protection in data publishing has become the focus of current research. This problem studies how to process the data so that the published data does not reveal the privacy of individuals and has high availability. At present, privacy protection techniques in data publishing are mostly based on static data sets. With the promotion of the Internet of things and the arrival of the big data era, the network click data, telephone call records, shopping data of large supermarkets and other data are usually shown as dynamic data flow, data stream has mass, real-time and dynamic variability. Traditional privacy protection techniques are not suitable for data flow environments. Transactional data flow is a common form of data flow, such as shopping data in shopping malls, in which each record is a collection of items. This data usually contains sensitive information about the user. At present, privacy protection in data stream publishing is mainly aimed at relational data stream. Because transactional data streams have the characteristics of high and sparse, the privacy protection techniques used to deal with relational data streams can not be directly applied to transactional data streams, and transactional data streams have real-time and dynamic variability. The traditional privacy protection method for static transaction data can not be directly applied to data flow environment. In this paper, the privacy protection of transactional data stream publishing is studied, and a method of privacy protection for transactional data stream publishing based on sliding window is proposed. The main research work is as follows: firstly, combining sliding window and 蟻 uncertainty privacy protection model, a 蟻-uncertainty model based on sliding window is proposed, that is, every sliding window is required to satisfy 蟻-uncertainty. When the arrival of new data and the deletion of old data make the data in the sliding window update continuously, which leads to the sliding window no longer meet the privacy requirements, this paper analyzes the effect of deleting and adding the child window on the sliding window. At the same time, the measurement method of information loss is given. Secondly, the affected association rules tree is established based on deleting and adding sub-windows, and the sensitive association rules which cause the current window not to meet the 蟻 -uncertainty privacy requirements are quickly found. The suppression method is used to select as few items as possible to delete so that the current window satisfies 蟻-uncertainty. In order to reduce the information loss of data, this paper further proposes a combination of suppression and generalizability, according to the information loss measure to determine whether to delete or generalize the items to make the current window meet the privacy requirements. Finally, the design scheme of the system and the detailed implementation process of each module are given. From the efficiency of data anonymity and the utility of data, this paper compares the proposed method with the method of using static transaction data anonymity directly. The experimental results show that the method proposed in this paper can be anonymous quickly. At the same time, the utility of the data can be effectively guaranteed.
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13;TP309

【相似文献】

相关期刊论文 前10条

1 李斌;数据流处理自动化和重新设计[J];管理科学文摘;1997年05期

2 侯太平,顾大权,王柏春,朱红伟;远程天气会商系统中的数据流处理[J];计算机工程;2003年03期

3 陈昕,宋瀚涛;基于数据流的近似查询计算及其应用研究[J];计算机应用研究;2003年11期

4 陈昕,陈维兴,苏锦祥;基于数据流模式的聚集快速查询计算研究[J];计算机集成制造系统;2004年06期

5 张冬冬,李建中,王伟平,郭龙江;分布式复式数据流的处理[J];计算机研究与发展;2004年10期

6 王金栋;周良;张磊;丁秋林;;一类数据流连续查询的降载策略研究[J];武汉大学学报(工学版);2005年06期

7 刘景春;;数据流分类关键技术研究[J];佳木斯大学学报(自然科学版);2007年01期

8 李琳;孙士兵;;数据流聚类方法发展研究[J];长沙民政职业技术学院学报;2008年04期

9 陈军;周明天;杨晓燕;;数据流系统降载研究综述[J];计算机应用研究;2008年10期

10 傅鹂;鲁先志;蔡斌;;一种基于数据流驱动的数据流连续查询模型[J];重庆工学院学报(自然科学版);2008年10期

相关会议论文 前10条

1 张冬冬;李建中;王伟平;郭龙江;;分布式复式数据流的处理[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

2 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 尹婷;李红燕;;窗口模型下数据流查询流水化执行的研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

4 孟军;张航黎;张建英;郭禾;;分布式数据流的渐增式聚集维护算法[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年

5 韩近强;杨冬青;唐世渭;;数据流处理中一种自适应的直方图维护算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

6 蔡致远;熊方;钱卫宁;周傲英;;核合并分析及其在数据流密度估计上的应用[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

7 王亦兵;杨树强;王晓伟;;一个面向数据流的多维分析系统的研究与实现[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年

8 于亚新;王国仁;陈灿;苏林;朱歆华;赵相国;;基于操作符优先级的两种分布式数据流负载分配算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

9 周锐;肖川;王国仁;韩东红;霍欢;;数据流滑动窗口连接上的卸载技术的研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

10 田李;王乐;贾焰;邹鹏;李爱平;;分布式数据流上低通信开销的连续极值查询方法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

相关博士学位论文 前10条

1 张丽;数据流上序敏感查询处理关键技术研究[D];国防科学技术大学;2013年

2 李飒;数据流软聚类理论及其在瓦斯灾害预警中的应用[D];辽宁工程技术大学;2014年

3 陈华辉;基于遗忘特性的数据流概要结构及其应用研究[D];复旦大学;2008年

4 孔英会;数据流技术及其在电力信息处理中的应用研究[D];华北电力大学(河北);2009年

5 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年

6 姚远;海量动态数据流分类方法研究[D];大连理工大学;2013年

7 曹振丽;面向养殖环境监测的数据流处理方法研究[D];中国农业大学;2015年

8 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年

9 袁志坚;数据流突发检测若干关键技术研究[D];国防科学技术大学;2008年

10 王金栋;数据流系统中负载管理技术应用研究[D];南京航空航天大学;2006年

相关硕士学位论文 前10条

1 王川;面向位置服务的物联网数据质量保证方法研究[D];南京理工大学;2015年

2 祝然威;基于时间窗口的数据流频繁项挖掘算法[D];复旦大学;2014年

3 邱孝兵;基于GPU的数据流聚类及相关性分析[D];大连理工大学;2015年

4 张野;数据流查询语言中语法分析器的设计[D];电子科技大学;2015年

5 闫新院;基于概要模型的数据流聚合技术研究[D];西安电子科技大学;2014年

6 王涛;基于Ntrip协议的实时数据流软件的设计与实现[D];西安电子科技大学;2014年

7 陈彬;数据流实时存储关键技术[D];浙江工业大学;2015年

8 王高洋;基于网格和加速粒子群优化的数据流聚类算法研究[D];哈尔滨师范大学;2015年

9 钱海振;大数据流滞后相关性挖掘方法[D];辽宁师范大学;2015年

10 刘祥佳;制造物联海量数据流模式挖掘算法研究[D];广东工业大学;2016年



本文编号:2169797

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2169797.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户866b8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com