锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

DeepLab系列(v1,v2,v3,v3+)总结

时间:2023-01-31 10:00:00 eak系列连接器的分类

U-net: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

  • 语义分割面临挑战
  • 1. DeepLab v1——《Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs》(ICLR 2015,谷歌)
  • 2. DeepLab v2——《DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs》(TPAMI 2017,谷歌)
  • 3. DeepLab v3 ——《Rethinking Atrous Convolution for Semantic Image Segmentation》(谷歌)
  • 4. DeepLab v3 ——《Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation》(ECCV 2018, 谷歌)
  • 5. 论文总结

语义分割面临挑战

  • 分辨率
    • 问题:连续池化或下采样操作会导致图像分辨率大幅下降,从而失去原始信息,在上采样过程中难以恢复
    • 减少分辨率损失的方法:
      • 空洞卷积
      • 用步长为2的卷积操作代替池化
  • 多尺度特征
    • 将不同尺度的特征图送入网络进行整合,大大提高了整个网络的性能
    • 然而,由于图像金字塔的多尺度输入,在计算过程中保存了大量的梯度,件的要求很高
    • 在测试阶段对网络进行多尺度训练和多尺度集成。如果网络遇到瓶颈,可以考虑引入多尺度信息,有助于提高网络性能。

1. DeepLab v1——《Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs》(ICLR 2015,谷歌)

  • 标题:基于深度卷积网络和全连接CRF语义图像分割

  • 论文:https://arxiv.org/pdf/1412.7062v4.pdf

  • 代码: https://bitbucket.org/deeplab/deeplab-public/src/master/(office)

  • 研究成果及意义:

    • 1.参数同比减少,内存比例减少,速度快
    • 2.ResNet网络越深,准确率越高
    • 3.连续卷积和池化必然会降低分辨率, 然而,在尽可能保证分辨率的情况下,空洞卷积可以扩大视野
    • 4.ASPP的创举
  • 摘要:

    • 背景概述:DCNNs最后一层不足以准确划分目标
    • 主要贡献:本文将深度卷积神经网络和CRF结合克服了深度网络的局部特性
    • 网络效果:DeepLab v超过以往方法的精度水平,可以更好地定位和划分边界
    • 实验结果:在PASCAL VOC 71.6%的IOU;在正常GPU上可达到每秒8帧的处理速度
  • 引言

    • DeepLab v1 结合深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法
      神经网络深度卷积(DCNNs)
      • 1.采用FCN思想,修改VGG16网络,得到 coarse score map并将插值插入像大小
      • 2.使用Atrous convolution得到更dense感觉野不变feature map概率图模型(DenseCRFs)
      • 3.借用fully connected CRF对从DCNNs细节上获得的分割结果refine。
  • 算法&实验

    • 1.全连接层(fc6、fc7、fc8)改为卷积层(端到端训练)
    • 2.最后两个池化层(pool4、pool5)步长2改为1(保证feature的分辨率)
    • 3.最后三卷积层(conv5_1、conv5_2、conv5_3)的dilate rate设置为2,第一个全连接层dilate rate设置为4(保持感觉野)
    • 4.最后一个全连接层fc8的通道数从1000改为21(分类数为21)
    • 5.第一个全连接层fc6.通道数从4096变为1024,卷积核大小从7x7变为3x3.在后续实验中发现这里dilate rate为12时(LargeFOV),效果最好
      在这里插入图片描述


  • 实验设置:

    • DeepLab-MSc:类似FCN,加入特征融合
    • DeepLab-7×7:全连接的卷积核大小为7×7
    • DeepLab-4×4.更换全连接的卷积核尺寸为4×4
    • DeepLab-LargeFOV:替换全连接的卷积核大小为3×3,空洞率为12

2. DeepLab v2——《DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs》(TPAMI 2017,谷歌)

3. DeepLab v3 ——《Rethinking Atrous Convolution for Semantic Image Segmentation》(谷歌)

  • 标题:学习反卷积网络的语义分割
  • 论文:https://arxiv.org/pdf/1706.05587v3.pdf
  • 代码:https://github.com/tensorflow/models/tree/master/research/deeplab
  • 摘要:
    • 主要贡献:为了解决多尺度下的分割问题,本文设计了级联或并行的空洞卷积模
      块;扩充了ASPP模块
    • 网络效果:网络没有经过DenseCRF后处理,也可得到不错的结果
    • 实验结果:在PASCAL VOC 2012数据集中获得了与其他最新模型相当的性能
  • 本文贡献
    • 1.本文重新讨论了空洞卷积的使用,这让我们在串行模块和空间金字塔池化的框架下,能够获取更大的感受野从而获取多尺度信息
    • 2.改进了ASPP模块:由不同采样率的空洞卷积和BN层组成,我们尝试以串行或并行的方式布局模块
    • 3.讨论了一个重要问题:使用大采样率的3×3的空洞卷积,因为图像边界响应无法捕捉远距离信息(小目标),会退化为1×1的卷积, 我们建议将图像级特征融合到ASPP模块中
  • 先验知识
    • 语义分割常用特征提取框架
  • 算法&实验
  • 实验设置
    • 深度学习框架:TensorFlow
    • 裁剪尺寸:裁剪图片至513*513
    • 学习率策略:采用poly策略,原理同v2
    • BN层策略:
      • 当output_stride=16时,batchsize=16,同时BN层做参数衰减0.9997
      • 在增强的数据集上,以初始学习率0.007训练30K后,冻结BN层参数
      • 当output_stride=8时,batchsize=8,使用初始学习率0.001训练30K

4. DeepLab v3+ ——《Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation》(ECCV 2018, 谷歌)

5. 论文总结

  • DeepLab系列发展历程:
    • v1:修改经典分类网络(VGG16),将空洞卷积应用于模型中,试图解决分辨率过低及提取多尺度特征问题,用CRF做后处理
    • v2:设计ASPP模块,将空洞卷积的性能发挥到最大,沿用VGG16作为主网络,尝试使用ResNet-101进行对比实验,用CRF做后处理
    • v3:以ResNet为主网络,设计了一种串行和一种并行的DCNN网络,微调ASPP模块,取消CRF做后处理
    • v3+:以ResNet或Xception为主网络,结合编解码结构设计了一种新的算法模型,以v3作为编码器结构,另行设计了解码器结构,取消CRF做后处理
锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章