论文阅读笔记:“Deformable Convolutional Networks”
sixwalter Lv6

Deformable Convolutional Networks

引言分析

cnn对于集合变换的建模主要来自,丰富的数据增强,大的模型容量以及一些简单的手工模块(max pooling)。CNN 不能对大的未知的变换进行建模。CNN模块的几何结构是固定的,卷积单元在固定的位置采样输入特征图。自适应感受野对视觉识别比较重要。论文提出了可变形卷积,能够大大增强CNN对集合变换的建模能力。

image-20220920154640208

核心亮点

image-20220920152538762

可变性卷积

如上图所示,可变形卷积可允许采样网格的自由变换。偏移量是通过之前的特征图学习得到的。

网格R:

image-20220920153139954

标准卷积:

image-20220920153457095

可变形卷积:

image-20220920153530542

因为经常为分数,因此可以使用双线性插值:

image-20220920153730571

其中G(q,p)为:

image-20220920153812261

只对少部分q来说,G(q,p)是非零的。

可变形卷积的过程如下图所示:

image-20220920154112646

实验分析

Deformable Convolution的效果

image-20220920160512918

卷积核感受野

image-20220920160902047
  • 感受野大小与物体大小有关
  • 背景区域的识别需要较大的感受野

与空洞卷积的比较

image-20220920161154619

模型运行时和复杂度

image-20220920161318802
  • Post title:论文阅读笔记:“Deformable Convolutional Networks”
  • Post author:sixwalter
  • Create time:2023-08-05 11:14:26
  • Post link:https://coelien.github.io/2023/08/05/paper-reading/paper_reading_046/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.
 Comments