论文阅读笔记：“Deformable Convolutional Networks”

sixwalter Lv6

2023-08-05 11:14:26 2023-08-05 11:14

303 Words 1 Mins

Deformable Convolutional Networks

引言分析

cnn对于集合变换的建模主要来自，丰富的数据增强，大的模型容量以及一些简单的手工模块(max pooling)。CNN 不能对大的未知的变换进行建模。CNN模块的几何结构是固定的，卷积单元在固定的位置采样输入特征图。自适应感受野对视觉识别比较重要。论文提出了可变形卷积，能够大大增强CNN对集合变换的建模能力。

核心亮点

可变性卷积

如上图所示，可变形卷积可允许采样网格的自由变换。偏移量是通过之前的特征图学习得到的。

网格R：

标准卷积：

可变形卷积：

因为经常为分数，因此可以使用双线性插值：

其中G(q,p)为：

只对少部分q来说，G(q,p)是非零的。

可变形卷积的过程如下图所示：

实验分析

Deformable Convolution的效果

卷积核感受野

感受野大小与物体大小有关
背景区域的识别需要较大的感受野

与空洞卷积的比较

模型运行时和复杂度

Post title：论文阅读笔记：“Deformable Convolutional Networks”
Post author：sixwalter
Create time：2023-08-05 11:14:26
Post link：https://coelien.github.io/2023/08/05/paper-reading/paper_reading_046/
Copyright Notice：All articles in this blog are licensed under BY-NC-SA unless stating additionally.