社交网络签名:网络数据中的重新识别框架-研究论文

时间:2024-06-09 05:30:06
【文件属性】:

文件名称:社交网络签名:网络数据中的重新识别框架-研究论文

文件大小:121KB

文件格式:PDF

更新时间:2024-06-09 05:30:06

social networks network-based re-identification statistical

大型动态社交网络(如电信网络和Internet)上的数据无处不在。 但是,以有利于有效的大规模分析的方式表示这些网络通常是一个挑战。 在本文中,我们专注于重新识别的分析任务。 动态网络环境中的重新标识本质上是一个匹配问题,涉及比较两个时间段内网络实体的行为。 实体的社交网络行为可以表示为“签名”。 可以将衡量签名重叠程度的相似性评分分配给在指定时间段内观察到的成对实体。 然后可以将分数用作预测模型中的属性,以将实体对分类为匹配或不匹配。 先前的研究已经报道了在电子邮件别名检测,作者归因和识别电信行业中欺诈用户方面的成功。 在这项工作中,我们解决了“为什么我们能够在现实世界中动态网络上重新标识实体?”的问题。 我们的贡献是双重的。 首先,我们通过匹配框架解决了规模挑战,该框架不需要成对比较来确定相似性得分。 我们采用随机网络结构来估计性能,并表明我们的估计值可以很好地预测具有不同特征(包括聚类系数,平均度,大小和不同网络类型,例如随机,小世界和无标度)的模拟网络。 其次,我们证明了我们的方法在第二个时间段内对丢失链接的鲁棒性强,但是对噪声的容忍度却较低,这是通过从第一个时间段到第二个时间段的行为变化进行建模的。 使用我们的框架,我们仅根据网络的度分布和动态性就可以对网络进行预测时提供性能评估。 这项工作对重新识别问题具有重大意义,在重新识别问题中,规模是一个挑战,而且在无法观察到假阴性的情况下(例如,当欺诈性消费者没有被标记为欺诈性消费者时)。


网友评论