1. 数据集

1.1 PASCAL VOC 数据集

[点击链接跳转](http: // host.robots.ox.ac.uk/pascal/voc/voc2012/)

image-20230328104138932

1.2 MS COCO 数据集

[点击链接跳转](http: /lcocodataset.org/)

image-20230328104235323

image-20230328104324396

2. 目标检测性能指标

2.1 检测精度和速度

image-20230328104415961

2.2 混淆矩阵

对分类用混淆矩阵来衡量

image-20230328104503369

True Positive(TP):真正类。样本的真实类别是正类,并且模型识别的结果也是正类。

False Negative(FN):假负类。样本的真实类别是正类,但是模型将其识别为负类。

False Positive(FP):假正类。样本的真实类别是负类,但是模型将其识别为正类。

True Negative(TN):真负类。样本的真实类别是负类,并且模型将其识别为负类。

该矩阵可用于易于理解的二类分类问题,但通过向混淆矩阵添加更多行和列,可轻松应用于具有3个或更多类值的问题。

一个简单的例子:检测苹果(P)或者橘子(N)

TP:实际是苹果预测也是苹果

TN:实际是橘子预测也是橘子

FP:实际是橘子预测是苹果

FN:实际是苹果预测是橘子

image-20230328105439360

2.3 交并比

image-20230328105631021

蓝色框是真实值,橘色框是预测值;两框重叠度越高越精准

image-20230328105816906

简单来讲就是可以用阈值判断检测是否有效

  1. 如果lou≥o.5,将对象检测归类为真阳性(TP)。
  2. 如果lou<0.5,则错误检测,并将其归类为假阳性(FP)。
  3. 当图像和模型中存在地面真值时,将其分类为假阴性(Fn)。
  4. TN是图像的每个部分,我们没有预测一个物体。这些度量标准对于对象检测并不有用,因此我们忽略了TN。

2.4 AP&MAP

image-20230328141245906

image-20230328141344583

image-20230328141355308

在COCO数据集上,MAP有自己的定义,有10个步长为0.05的iou阈值,取平均值就为上式所示。

image-20230328141601263

精度、召回率及其尺寸

image-20230328141741758

2.4.1 例子(计算AP)

image-20230328141930408

image-20230328142153636

image-20230328142227777

2.4.2 11点法(2010年之前)

image-20230328142302839

2.4.3 积分法AUC(2010年之后)

image-20230328142405494

image-20230328142428837

2.4.4 小结

image-20230328142558465

2.5 检测速度(ms、FPS、FLOPS)

image-20230328142534641

Logo

一站式 AI 云服务平台

更多推荐