计算机视觉——目标检测常用数据集和性能指标介绍
计算机视觉——目标检测常用数据集和性能指标介绍,包括VOC和COCO的简介和ap&MAP等指标的介绍
·
目标检测常用数据集和性能指标介绍
1. 数据集
1.1 PASCAL VOC 数据集
[点击链接跳转](http: // host.robots.ox.ac.uk/pascal/voc/voc2012/)

1.2 MS COCO 数据集
[点击链接跳转](http: /lcocodataset.org/)


2. 目标检测性能指标
2.1 检测精度和速度

2.2 混淆矩阵
对分类用混淆矩阵来衡量

True Positive(TP):真正类。样本的真实类别是正类,并且模型识别的结果也是正类。
False Negative(FN):假负类。样本的真实类别是正类,但是模型将其识别为负类。
False Positive(FP):假正类。样本的真实类别是负类,但是模型将其识别为正类。
True Negative(TN):真负类。样本的真实类别是负类,并且模型将其识别为负类。
该矩阵可用于易于理解的二类分类问题,但通过向混淆矩阵添加更多行和列,可轻松应用于具有3个或更多类值的问题。
一个简单的例子:检测苹果(P)或者橘子(N)
TP:实际是苹果预测也是苹果
TN:实际是橘子预测也是橘子
FP:实际是橘子预测是苹果
FN:实际是苹果预测是橘子

2.3 交并比

蓝色框是真实值,橘色框是预测值;两框重叠度越高越精准

简单来讲就是可以用阈值判断检测是否有效
- 如果lou≥o.5,将对象检测归类为真阳性(TP)。
- 如果lou<0.5,则错误检测,并将其归类为假阳性(FP)。
- 当图像和模型中存在地面真值时,将其分类为假阴性(Fn)。
- TN是图像的每个部分,我们没有预测一个物体。这些度量标准对于对象检测并不有用,因此我们忽略了TN。
2.4 AP&MAP



在COCO数据集上,MAP有自己的定义,有10个步长为0.05的iou阈值,取平均值就为上式所示。

精度、召回率及其尺寸

2.4.1 例子(计算AP)



2.4.2 11点法(2010年之前)

2.4.3 积分法AUC(2010年之后)


2.4.4 小结

2.5 检测速度(ms、FPS、FLOPS)

更多推荐




所有评论(0)