sematic-seg-review
calcium_oxide Lv3

语义分割论文综述

前置常用理论和技巧

  1. 超像素
  • Turbopixel
  • SLIC
  1. CRF
  1. hard-pixel-aware

方法总结

数据集

语义分割论文分类

总结

FCN提出全卷积神经网络进行语义分割, https://arxiv.org/abs/1411.4038,从此语义分割进入了深度学习的时代。

此后语义分割主要围绕着有效的上下文信息,高分辨率特征表示,引入额外信息(边界),超高分辨率分割等角度展开。

目前比较火的是使用transformer进行语义分割的研究。

有效上下文信息

  1. 空间上下文

    • 金字塔结构,Pyramid Scene Parsing Network(PSPNet)

    • Deeplab系列,使用ASPP结构和空洞卷机,包括V1,V2,V3,plus

  2. 相关上下文

    • Dual Attention Network for Scene Segmentation(DANet)。自注意机制position attention + channel attention
    • Object-Contextual Representations for Semantic Segmentation(OCRNet)。像素所属类别的特征对像素进行增强
    • CCNet: Criss-Cross Attention for Semantic Segmentation(CCNet)。降低attention计算量
    • Context Encoding for Semantic Segmentation(EncNet)。使用传统视觉中残差编码来建模上下文
    • Disentangled Non-Local Neural Networks。attention解耦为pairwise term和unary term分别进行学习
  3. 空间+相关上下文

    • Adaptive Pyramid Context Network for semantic Segementation,结合金字塔更改attention的采样位置

高分辨率特征表示

  1. Deep High-Resolution Representation Learning for Visual Recognition(HRNet),维持高分辨率分支
  2. Encoder-Decoder恢复原始分辨率
    • SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation,记录池化的索引,在decoder部分直接使用索引还原
    • Semantic Flow for Fast and Accurate Scene Parsing(SFNet)。使用光流进行不同阶段特征融合。
    • GFF: Gated Fully Fusion for Semantic Segmentation,使用soft gate机制取控制不同阶段的特征融合。

引入额外信息(边界)

  1. Gated-SCNN: Gated Shape CNNs for Semantic Segmentation,引入额外的分支监督语义边缘
  2. SegFix: Model-Agnostic Boundary Refinement for Segmentation,通用的边界区域后处理模块
  3. hard-pixel-aware:
    • Loss Max-Pooling for Semantic Image Segmentation
    • Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade

超高分辨率分割

  1. Collaborative Global-Local Networks for Memory-Efficient Segmentation of Ultra-High Resolution Images。将原图下采样和crop分别输入到网络中

skip connection

  1. unet
  2. unet++

语义分割transformer结构

  1. Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers,VIT结构应用在语义分割上;
  2. SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers,在transformer中引入多尺度特征;
  3. Per-Pixel Classification is Not All You Need for Semantic Segmentation,在transformer中使用聚类思想进行语义分割。
  • Post title:sematic-seg-review
  • Post author:calcium_oxide
  • Create time:2023-02-07 10:50:10
  • Post link:https://yhg1010.github.io/2023/02/07/sematic-seg-review/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.