1. Introduction
该论文提出了一种基于难样本三元组损失函数的层次聚类方法来进行无监督ReID,性能超过其他无监督方法和部分cross domain方法。
贡献:
- 提出纯无监督框架HCT。
- 将难样本三元组损失引入无监督ReID中。
- 提出一种层次聚类方法,考虑到集群中间的总体距离。
2. Methods
算法的总体流程是利用在ImageNet上预训练过的ResNet50网络作为backbone框架,对target domain的所有图像提取特征构成特征空间,对于得到的特征进行有层次的聚类,在聚类完成之后,将同一个集群视为同一行人。从所有集群中抽取P个集群,每个集群抽取K张图片,构成一个hard batch对ResNet50网络进行难样本三元组损失训练。
有层次的聚类
- s step步骤
- c cluster数量
- n 总样本数
- mp merge percent 合成比例
- m = mp * c合成数量 将m对样本相接
在初始化时,认为所有样本的特征都是不同的id,也就是有n个集群。
计算集群之间的距离。集群之间的距离利用平均距离来计算:
获得c*c的距离矩阵,取距离最近的前m对集群相连。
在进行s次连接之后,将其作为最终聚类结果。
难样本三元组损失训练
对于聚类结果的每个集群都认为是同一id,分配同一标签。
在聚类结果中抽取P个集群,每个集群取K个节点,构造hard batch,进行难样本三元组训练。
总算法