Laplace噪声的概率累积函数
Laplace噪声概率函数
f(x∣μ,b)=2b1eb−∣x−μ∣
Laplace噪声的概率累积函数
F(x∣μ,b)={21e−bμ−x,x<μ1−21e−bx−μ,x⩾μ
做出其图像为:
这个函数莫名像sigmod函数,有木有!
由于概率累计分布的值域区间为[0,1],因此在生成Laplace噪声之前应该先生成区间在[0,1]之间的满足均匀分布的随机值。
通过求解概率累积函数的反函数即可求得累积函数的反函数即可求得满足Laplace分布的噪声。
计算的方法见MathThinker,这里的计算还是很简单的,自己可以搞定。
他的求解方法,看懂了。求反函数的基本套路,反解法。反函数的图像和原图像关于直线y=x对称。
若,ξ−Uni(0,1)满足均匀分布,则
逆累积分布函数为:
x={bln(2ξ)+μ,ξ<21μ−bln(2(1−μ)),ξ⩾21
若,ξ−Uni(−0.5,0.5)满足的均匀分布。假定ξ′−Uni(−0.5,0.5),则ξ′+0.5−Uni(0,1)的均匀分布,令ξ=ξ′+0.5,采用上述的结论得:
x={μ+bln(1+2ξ′),ξ′<0μ−bln(1−2ξ′),ξ′⩾0
这样说的好处是,可以是将分段函数统一。
x=μ−b∗sign(ξ′)∗ln(1−2∗sign(ξ′)∗ξ)
兄弟数据集解释
对称差集⨁
对称差集⨁:集合运算式,T=R⨁S=(R∪S)−(R∩S)
记Δ=∣R⨁S∣表示对称差集中的元素个数。
而集合R和集合S为兄弟数据集当且仅当∣R⨁S∣=1。
差分隐私定义概念延展(完整版)
对于∀D,D′满足∣D⨁D′∣=1,O∈Range(A),如果算法A满足Pr[A(D)=O]⩽eε∗∣D⨁D′∣∗Pr[A(D′)=O],则算法A满足ε∗∣D⨁D′∣-差分隐私。
由于定义的前提是满足∣D⨁D∣=1,所以就变成了ε-差分隐私。
注:接下来的原理解释,需要用到∣D⨁D∣的性质
差分隐私的组合原理
差分隐私的串行组合原理
- 条件:
- 算法Ai(D)分别满足εi-差分隐私
- 任意两个算法的随机过程相互独立
- 结论:
- 算法满足i=1∑mεi-差分隐私
差分隐私的并行组合原理
-
这里说的并行指的是,输入数据集的并行。
-
定义差分隐私算法所保护数据库集合D的元素x定义在集合R上,即R=domain(x),因此有D⊆R。
令{R1,R2,…,Rt}为R的一种划分,满足R=i=1⋂tRi,Ri∩Rj=∅,i=j。
例如:差分隐私所保护的数据库中存储关于人的信息数据。其中D表示一个具体的数据集作为算法的输入,而R表示所有可用来表示一个人的信息集合。假定一种可能的划分是按照性别对数据库中的人进行划分,从而将人分为,男性,女性和未知,分别用R1,R2,R3表示每种可能出现的所有人的集合。这些不同性别的人直接没有交集,同时合在一起组成所有的人。根据该划分规则可以将数据集划分为不同的自己,将满足划分子类Ri的数据自己为Di,则Di=D∩Ri。(这种数据集划分规则有种,完备集的赶脚,只是这种划分规则的指定,就很有说法了。)
-
结论
算法满足ε-差分隐私。
重要说明(证明)
∀i=j,Di∩Dj=∅,Di′∩Dj′=∅,因此对于i=1∑m∣Di⨁Di′∣推论如下:
i=1∑m∣Di⨁di′∣=∣i=1⋃m(Di⨁di′)∣=∣i=1⋃m((D∩Ri)⨁(D′∩Ri))∣=∣i=1⋃m((D⨁D′)⨁Ri)∣=∣((D⨁D′)∩i=1⋃mRi∣=∣(D⨁D′)∩R∣
因为R为元素的定于有D⊆R,D′⊆R。因此,上述的推导最终结果为:
i=1∑m∣Di⨁Di′∣=∣D⨁D′∣=1
因此,在并行组合下的差分隐私算法满足ε-差分隐私。
推论
参考自MathThinker