SPP Net

作者: yalesaleng | 来源:发表于2017-06-27 15:50 被阅读56次

SPPnet

R-CNNvsSPP net:

SPP net的优势:

1.SPP可以生成固定大小的向量,以此适应fc层所要求的固定输入

2.多个pooling窗口,可以取出不同层次的特征

3.可以不再限制输入图片的尺寸

4.对于每张图片只需要跑一遍CNN

SPP net的大体步骤:

1.假设原图输入是224*224,5个conv layers(以5层卷积为例)卷积出来的输出是13*13*256(因为最后一层共256个filter),即13*13大小的共256张feature maps;

2.spp一共分3层:

第一层是对整张feature map做池化(最大、均值等);

第二层是将整张feature map划分为2*2=4个块,分别对每个块做池化;

第三层是将整张feature map划分为4*4=16个块,分别对每个块做池化。

注意!以上步骤每一步的max pooling的window size和stride都不同,具体的计算公式是:win= a/n(上舍入), str = a/n(下舍入),其中a是原图经过5层卷积后得到的feature map的大小,如果是第三层那么n = 3,以此类推。

举个栗子:当a = 13时,win = 13/3 = 4.333 ~=5(因为上舍入),str = 13/3 = 4.3333 ~=4(因为下舍入)。所以了第三层的max pooling的sliding window大小就是5*5,stride就是4*4。以此类推。

当然了,每一张图的max pooling也不一样。

举个栗子:当输入图像大小= 180*180时,经过5层卷积后得到的feature map的大小就是10*10。那么第三层的max pooling的sliding window大小就是a/n = 10/3 = 3.333~=4,stide就是3。以此类推。

具体内容请参考原文:

当输入是224*224大小的图像时,5层conv后得到13*13:

当输入是180*180大小的图像时,5层conv后得到10*10:

通过以上步骤,最后可获得1+4+16=21个池化后的特征。

总的来说,在固定spp层数的前提下,就是根据图像的具体大小来设计具体的max pooling。最终保证输入到fc层的结果是相同维度大小的。

相关文章

  • SPP Net

    SPP Net SPP:Spatial Pyramid Pooling(空间金字塔池化) SPP-Net是出自20...

  • SPP Net

    SPPnet R-CNNvsSPP net: SPP net的优势: 1.SPP可以生成固定大小的向量,以此适应f...

  • SPP-Net

    SPPNet Abstract Key insight 传统的CNN要求输入图像尺寸是固定的,所以通常要改变图片的...

  • 检测之旧文新读(三)-Fast R-CNN

    动机: 可以说这一篇论文,是进一步的优化SPP-Net在检测上面的工作。那么作者肯定是看到SPP-net针对检测的...

  • 读论文系列:Object Detection SPP-net

    本文为您解读ECCV2014 SPP-net: Spatial Pyramid Pooling in Deep C...

  • 语义分割(2)SPP net

    Spatial Pyramid Pooling in Deep Convolutional Networks fo...

  • 4. SPP-Net

    基于深度学习的目标检测技术演进:R-CNN -> SPP-Net -> Fast-RCNN -> Faster-R...

  • 5. Fast R-CNN

    基于深度学习的目标检测技术演进:R-CNN -> SPP-Net -> Fast-RCNN -> Faster-R...

  • SPP-net文章详细解读

    文章《Spatial Pyramid Pooling in Deep Convolutional Networks...

  • 2016-04-14 今日收集

    【目标识别】深度学习进行目标识别的资源列表:O网页链接包括RNN、MultiBox、SPP-Net、DeepID-...

网友评论

    本文标题:SPP Net

    本文链接:https://www.haomeiwen.com/subject/lusecxtx.html