图像检索评价指标
1. Precision & Recall & F-Score
Precision - 查准率;准确率
Precison=检索到的相似图片个数检索到的全部图片总数=预测为正样本的图片个数所有被预测为正样本的图片总数
Recall - 查全率;召回率
Recall=检索到的相似图片个数数据集里全部相似图片总数=预测为正样本的图片个数所有正样本的图片总数
查全率与查准率互相影响,最理想的是二值都高. 但一般情况下是,{查全率高,查准率低},{查全率低,查全率高}.
保证查全率的情况下,提升查准率——搜索任务等;
保证查准率的情况下,提升查全率——疾病监控、反垃圾邮件、地震检测、金融欺诈等;
F-Score - 对于查全率与查准率都具有较高要求
F−Score=(1+β2)Precision⋅Recallβ2⋅Precision+Recall
调节 β 值可以控制 Precision 和 Recall 的权重, β<1,查准率更重要;β>1,查全率更重要.
β=1时,称为 F1-score 或 F1. F1=2∗Precsion∗RecallPrecsion+Recall
注:分类问题中的 准确率(accuracy)=正确分类的样本数样本总数
2. AP & mAP
图像检索精度(average precision, AP)
图像平均检索精度(mean average precision, mAP)
假设图像库中与待查询图片相似的图片数为 N,
第一次查询,返回 N1 张图片
Top k |
top1 |
top2 |
top3 |
|
top k1 |
返回的相似图片数 |
n1
|
n2
|
n3
|
|
nk
|
查准率 (precison) |
n1/1
|
n2/2
|
n3/3
|
|
nk/k1
|
查全率 (recall) |
n1/N
|
n2/N
|
n3/N
|
|
nk/N
|
第一次查询的检索精度 AP1=(n1/1+n2/2+n3/3+...+nk/k1)/k1
第二次查询,返回N2 张图片
Top k |
top1 |
top2 |
top3 |
|
top k2 |
返回的相似图片数 |
t1
|
t2
|
t3
|
|
tk
|
查准率 (precison) |
t1/1
|
t2/2
|
t3/3
|
|
tk/k2
|
查全率 (recall) |
t1/N
|
t2/N
|
t3/N
|
|
tk/N
|
第二次查询的检索精度 AP2=(t1/1+t2/2+t3/3+...+tk/k2)/k2
平均查询精度 mAP=(AP1+AP2)/2
一个很好的图片概括: