文件名称:deanonymization:去匿名管道
文件大小:58KB
文件格式:ZIP
更新时间:2024-05-06 13:18:01
Python
MICS 233隐私工程实施 小组成员 亚伦·克劳奇(Aaron Crouch),卡梅隆·克利福德(Cameron Clifford),扎克·Childers(Zach Childers) 大规模去匿名 我们知道有许多知名度较高的论文,其中据称$ k $值较低的匿名数据集被取消匿名。 该过程非常简单,仅包含两个表的匹配概括,并且等效于SQL内部联接。 考虑到攻击数据集相对容易,我们想设计一个大规模自动化去匿名化的系统。 此过程包含三个主要阶段,这些阶段构成了典型的大数据管道: 入口,从各种来源收集匿名数据 处理,其中选择并攻击数据 出口,我们在其中准备已标识的数据以进行其他处理和解释。 我们的设计允许系统扩展以处理任意数量的数据。 通过利用现成的云技术,我们可以使用已经在课堂上编写的代码(特别是在实验2和3中)的改编来实现这一规模。 如果我们遇到无法预料的挑战,则所提议的里程碑中的
【文件预览】:
deanonymization-master
----ingress()
--------.gitignore(20B)
--------app()
--------README.md(181B)
--------parser.dockerfile(222B)
--------scraper.dockerfile(261B)
--------.vscode()
--------ingress-build.yml(1KB)
----res()
--------DeanonymizePipeline.png(31KB)
----processing()
--------.gitignore(9B)
--------processor-build.yml(335B)
--------dockerfile(318B)
--------notebooks()
--------README.md(410B)
----egress()
--------README.md(75B)
--------egress-build.yml(78B)
----init.sh(384B)
----README.md(8KB)
----.vscode()
--------settings.json(277B)
----azure-pipelines.yml(823B)