文件名称:半监督聚类的匿名数据发布 (2011年)
文件大小:306KB
文件格式:PDF
更新时间:2024-07-03 16:49:31
工程技术 论文
为增强个体与隐私信息的保护力度,提高数据效用和降低时间代价,提出半监督聚类的(α,k)匿名模型,并设计算法予以实现,分析了算法时间复杂度.针对数据集包含数值属性和分类属性的特点,把数值属性和分类属性映射到相同的度量空间进行运算,以相异矩阵表示数据集元组之间的距离,使相同或者相近的元组有效地聚集到同一个簇内.把高敏感度属性设置较高的保护度,低敏感度设置较低的保护度,实现了敏感属性的个性化保护.实验结果表明,半监督(α,k)匿名模型可安全且高效地实现隐私保护,保证了发布数据的质量.