数据交易中的关系型数据隐私保护研究
发布时间:2021-01-14 02:57
数据交易是打破信息孤岛及行业信息壁垒,实现数据价值最大化的新兴产业。在数据交易过程中,数据常以免费公布或交易给买方的形式被发布出去,而发布的数据中包含着大量的个人信息。攻击者可以根据这些个人信息,以数据挖掘技术手段进行信息分析,从而使得个人隐私发生泄漏进而造成经济损失和人身伤害等问题。为此,如何保护数据交易中个人隐私安全已经成为亟待解决的问题。为了确保数据交易中的隐私安全,人们需要对数据进行隐私完全自治处理,这是个人对数据确权的一种体现,也是个人实现对隐私主动保护的有效手段。同时在数据交易中,实时数据是一种极有价值的数据,如何防止实时数据发布的隐私泄露,进而确保数据交易安全实施也是一个重要的问题。目前,研究者们已经提出了大量的隐私保护方法,然而这些模型并不能有效地保护经过完全自治处理过的数据的隐私,且对于实时发布的隐私保护亦没有提出合理的隐私保护模型。为了保护隐私完全自治后的数据的发布安全,本论文提出了(α,ω)-匿名模型,该模型允许用户(数据拥有者)对关系型数据的准标识符(QI)以及敏感属性值(S)同时进行隐私约束设置,以体现用户对隐私拥有完全自治权,模型中的w是QI的隐私约束,a是...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
(a)域概化层次结构;(b)属性值概化层次结构
表示为jiD D。对于给定的属性 A,我们也表示概化,也可以表示为:nfAAAnff10101 化函数序列。根据属性 A 的偏序关系,我们 域概化层次ADGH 和值概化层次AVGH ,如(a) (b)图 2.1 (a)域概化层次结构; (b)属性值概化层次结构通常决定了属性泛化的规则。在概化层次结:数值属性和分类属性。图 2.1 显示了数值的为分类属性的概化层次结构。
定义 2.13 (信息损失度量,Information Loss):每一个匿名算法都需要一个特定的信息损失度量指标来对信息损失进行衡量。本论文使用的匿名化后信息损失的度量指标为 Xu 等人提出的归一化确定性补偿(Normalized Certainty Penalty)。定义 2.14 (归一化确定性补偿,Normalized Certainty Penalty)[26]:对于某个属性 A 上某个属性值 x 的信息损失计算方式为:()()()IntervalAIntervalxNCPxA ,属性 A 为数值型属性,Interval(x)表示 x 的取值区间大小,Interval(A)表示属性 A 的取值区间大小,在如图 2.3 中 age 概化层次中,若 x=[1, 30]且属性 A 表示 age,则 Interval(x)=30,Interval(A)=60, NPC(x)A=30/60,也就是说[1, 30]在 age 属 性 上 的 信 息 损 失 为 0.5 。 当 属 性 A 为 分 类 型 属 性 时 , 则NCP( x)Sub(x)/Sub(A)Anodenode , Sub(x)node表示以 x 为根节点的叶节点数, Sub(A)node表示该属性概化层次包含的叶节点总数,在图 2.4 中若 x 为 individual enterprise,则 Sub(x)node=2,若属性 A 表示有工作类型,则 Sub(A)node=4,所以 individualenterprise 在工作类型属性上的信息损失为 1/2。
本文编号:2976069
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
(a)域概化层次结构;(b)属性值概化层次结构
表示为jiD D。对于给定的属性 A,我们也表示概化,也可以表示为:nfAAAnff10101 化函数序列。根据属性 A 的偏序关系,我们 域概化层次ADGH 和值概化层次AVGH ,如(a) (b)图 2.1 (a)域概化层次结构; (b)属性值概化层次结构通常决定了属性泛化的规则。在概化层次结:数值属性和分类属性。图 2.1 显示了数值的为分类属性的概化层次结构。
定义 2.13 (信息损失度量,Information Loss):每一个匿名算法都需要一个特定的信息损失度量指标来对信息损失进行衡量。本论文使用的匿名化后信息损失的度量指标为 Xu 等人提出的归一化确定性补偿(Normalized Certainty Penalty)。定义 2.14 (归一化确定性补偿,Normalized Certainty Penalty)[26]:对于某个属性 A 上某个属性值 x 的信息损失计算方式为:()()()IntervalAIntervalxNCPxA ,属性 A 为数值型属性,Interval(x)表示 x 的取值区间大小,Interval(A)表示属性 A 的取值区间大小,在如图 2.3 中 age 概化层次中,若 x=[1, 30]且属性 A 表示 age,则 Interval(x)=30,Interval(A)=60, NPC(x)A=30/60,也就是说[1, 30]在 age 属 性 上 的 信 息 损 失 为 0.5 。 当 属 性 A 为 分 类 型 属 性 时 , 则NCP( x)Sub(x)/Sub(A)Anodenode , Sub(x)node表示以 x 为根节点的叶节点数, Sub(A)node表示该属性概化层次包含的叶节点总数,在图 2.4 中若 x 为 individual enterprise,则 Sub(x)node=2,若属性 A 表示有工作类型,则 Sub(A)node=4,所以 individualenterprise 在工作类型属性上的信息损失为 1/2。
本文编号:2976069
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2976069.html