文件名称:共享分布式交易数据时保护隐私-研究论文
文件大小:195KB
文件格式:PDF
更新时间:2024-06-09 05:16:12
data quality distributed data accuracy
跨组织共享数据时需要保护隐私已被视为一个重要问题。 在交易数据的上下文中,通常通过在共享之前显式隐藏敏感信息来保护隐私。 通常,要共享的数据是由数据所有者以分布式方式存储的,其中数据库是水平分区的,以反映公司在不同位置或区域的运营。 在这种情况下,所有者必须考虑不仅在统一数据库中隐藏敏感模式,而且还考虑在分布式数据库的每个分区内隐藏敏感模式。 我们提出了一种整数编程(IP)公式,用于在隐藏敏感模式的同时最大程度地减少分布式数据库的数据失真。 对于具有多个分区的分布式数据库,此公式可能会变得很大,并且IP可能无法解决。 对于这种情况,我们提出了三个替代过程-过程A,过程B和过程混合-利用数据的分布式性质将较大的问题分解为一系列较小的问题。 我们使用计算实验来检查这些程序的性能。 主要发现是:i)通过这三个程序可以轻松解决无法解决的最佳尺寸问题; ii)从过程A或过程B获得的解与最优解之间的差异很小; iii)混合过程在其他两个过程所提供的解决方案之间具有相同的配方共同性,从而能够获得更接近于最优方案的解决方案。