论文阅读笔记：“Squeeze-and-Excitation Networks”

sixwalter Lv6

2023-08-05 11:14:26 2023-08-05 11:14

768 Words 2 Mins

Squeeze-and-Excitation Networks(2019)

引言分析

之前的行为识别研究主要是针对时空依赖，时空注意力进行建模（模块设计），去改进现有的一个网络架构。这篇文章从通道的角度研究了一种不同的网络设计方法。

核心亮点

SE-Block

SE块可以显示地对通道之间的相互依赖进行建模，以得到一个更好的特征表达。这个模块做的实际上就是特征重标定，通过利用全局信息去选择性的增强有用信息并抑制无用信息。如图所示，该模块分为了两个操作：squeeze(挤压)和excitation（激活）。squeeze操作实际上就是沿着空间维度聚合特征图，得到一个沿着通道维度全局分布的特征响应。excitation是一个门控机制，以embeddings为输入，产生一个每个通道的权重集合。

Sqeeze：空间信息聚合

这里的squeeze操作作者采用的是全局平均池化，来生成每个通道的统计数据。

Excitation：自适应重标定

论文采用了一种简单的门控机制来进行重标定，因为s是通道权重的集合，SE块也是固有地引入了基于输入的动态性，所以也可以看作基于全局通道的自注意力机制。

将SE模块融入现有的模块中

网络结构

如图在每个残差块的尾端加入SE块

实验结果

加入SE模块的效果与网络深度的关系

如表所示，resnet-152的 top-5 error高于SENet-101的top-5 error，证明了SENet的精度增长不仅仅是由深度带来的，而且深度越深，精度越高，证明使用SE块和增加深度是相互补充的。

与现代架构进行集成的效果

从上表和下表可以看出，将SE块融入主流backbone可以显著提高精度。

SE块的泛用性不限于网络架构也不限于数据集

可以看出，对于其他数据集，分类精度也有显著提高。

SE的泛用性也不局限于图像分类任务

作者在场景分类、目标检测任务上进行了实验，结果均有提升：

与state-of-arts的对比

消融实验1：缩减比率对于SE-ResNet50的影响

消融实验2：squeeze操作符对精度的影响

消融实验3：excitation操作符对精度的影响

消融实验4：SE块的集成阶段对精度的影响

消融实验5：SE块的集成的具体位置对精度的影响

如上图，作者设计了不同SE模块插入位置的集成块，实验结果如下表：

值得注意的是，mobilenetV3的创新点之一和table15所做的实验是重合的，但是这里只是简单说将SE模块可以放入残差块里，mobilenetV3做了充分的实验对其进行验证和补充。

Post title：论文阅读笔记：“Squeeze-and-Excitation Networks”
Post author：sixwalter
Create time：2023-08-05 11:14:26
Post link：https://coelien.github.io/2023/08/05/paper-reading/paper_reading_032/
Copyright Notice：All articles in this blog are licensed under BY-NC-SA unless stating additionally.