[论文笔记]Speed/accuracy trade-offs for modern convolutional object detectors

论文链接:https://arxiv.org/pdf/1611.10012.pdf

这篇论文是由谷歌发表的,主要在速度和准确性两方面来权衡目标检测算法的性能,主要比较了三个经典的目标检测算法(Faster-rcnn, SSD, R-FCN),这三种算法分别使用六种特征提取器来实现检测( VGG-16, Resnet-101, Inception v2, Inception v3, Inception Resnet (v2), MobileNet ),使用开源框架Tensorflow。
三种算法原理图

这里写图片描述

虽然在SSD和R-FCN论文中都讲到无论是在速度上还是在准确度上都要比Faster-rcnn要好,但是在同样的网络结构,训练方法等条件下,该论文证明其实还是Faster-rcnn的准确性要好,但是速度方面却不占优势。看下图

这里写图片描述

上图可以看出还是Faster-rcnn(圆圈)的mAP比较高,但是速度却是慢了些。
下图展示的是不同算法对不同大小物体(large,medium,small)的检测精度,可以看出大目标的检测精度就是比小目标的检测精度要高,Faster-rcnn的效果也最好(多数情况下)

这里写图片描述

在特征提取器比较中,Inception Resnet (v2) 结构是效果最好的,看下图

这里写图片描述

可以看出没有一种算法可以在速度和准确性上都做的很好,本篇文章给出了根据自己的目标选择的依据(看中速度还是看中准确性还是两者兼顾),下面是几张效果图

这里写图片描述

相关文章
相关标签/搜索